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EE AAA 
INTRODUCCION 


El Algebra lineal es una rama de las Matemáticas tan antigua 
como la propia Matemática. El problema de la solución de la ecua- 
ción lineal ax+6b=0 puede ser considerado como el problema pri- 
mario del Algebra lineal. Aunque este problema no representa di- 
ficultad alguna, el método de su solución, así como las propiedades 
de la función lineal correspondiente y =ax+b, son los modelos de 
partida para las ideas y los métodos de toda el álgebra lineal. Por 
ejemplo, la teoria de la solución de un sisternma de ecuaciones con 
varias incógnitas se basa en la idea de la sustitución del sistema 
dado por una cadena de ecuaciones del tipo indicado y de la forma 
más sencilla. 

La importancia de los sistemas de ecuaciones lineales aumentó 

particularmente con la creación de la Geometría analitica, que per- 
mitió reducir todos los problemas principales sobre la posición de 
planos y rectas en el espacio al estudio de sistemas de ecuaciones 
lineales. Ya en el siglo XVIII la búsqueda de fórmulas generales 
ara la solución de un sisternma de n ecuaciones con n incógnitas 
levó a Leibniz y a Cramer al concepto de determinante. En el 
siglo XIX, además del Algebra y de la Geometría analítica, los 
determinantes traron también en el Análisis con los trabajos de 
Ostrogradski, Jacobi (determinantes funcionales), Wronski y otros. 
Paralelamente en la Geometría analítica, en la teoría de los núme- 
ros y especialmente en la mecánica teórica adquiría cada vez mayor 
importancia el problema de transformación de formas cuadráticas 
mediante sustituciones lineales de las variables. Este problema re- 
sultó ser también uno de los centrales en el desarrollo de las ideas 
geométricas de Lobachevski y de Riermann, que llevó a la creación 
de la teoría de espacios lineales multidimensionales (Grassmann). 
A mediados del siglo pasado y en relación con el estudio de ál- 
gebras no conmutativas (Hamilton) apareció en los trabajos de Cay- 
ley y de Sylvester el cálculo de matrices, que en el desarrollo 
posterior del da lineal pasó a ocupar uno de los puestos prin- 
cipales. A finales del siglo XIX quedaron creados los capitulos 
principales del cálculo de matrices: forma normal de una matriz de 
una transformación lineal (Jordan), divisores elementales (Weierstrass), 
pares de formas cuadráticas (Wejerstrass, Kronecker), formas hermi- 
tianas (Hermite). El desarrollo de la geometría diferencial de espa- 
cios multidimensionales y de la teoría de transformaciones de for- 
mas algebraicas de órdenes superiores llevó, a finales del siglo 
XIX, a la creación del cálculo tensorial. 

En el siglo actual los métodos del Algebra lineal han encontrado 
amplia aplicación y han sido desarrollados en la teoría de anillos 
y módulos, en la teoría de representaciones de grupos, así como en 
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la teoría de espacios topológicos vectoriales y otros capítulos del 
Analisis funcional. Ya en las dos últimas décadas la teoria de de- 
sigualdades lineales y la teoría de espacios afines multidimensiona- 
les, estrechamente ligada a la primera, han ocupado uno de los 
lugares centrales en una rama tan conocida de la matemática apli- 
cada como es la teoría de operaciones. Gracias a ello los elementos 
de la teoría de espacios afines multidimensionales constituyen ahora 
un momento indispensable en la formación matemática de ingenie- 
ros y economistas. 

En el Algebra lineal se estudian objetos de tres géneros: ma- 
trices, espacios y formas algebraicas. Las teorías de estos objetos 
están estrechamente vinculadas. La mayoría de los problemas del 
Algebra lineal admite un enunciado natural en términos de cada 
una de las tres teorías señaladas. El enunciado matricial es gene- 
ralmente el más cómodo para los fines de cálculo. Por otra parte, 
en la geometría y en la mecánica la mayoría de los problemas del 
Algebra lineal aparece como problemas de estudio de formas alge- 
braicas. Sin embargo, la comprensión más clara de las relaciones 
internas de diferentes problemas del Algebra lineal se alcanza so- 
lamente al considerar los espacios lineales correspondientes que son 
por ello el objeto principal de estudio en el Algebra lineal. 

Desde el punto de vista de la teoría de formas el contenido 
del Algebra lineal se descompone de modo natural en la teoría de 
formas lineales, cuadráticas y de órdenes superiores. El álgebra 
lineal propiamente dicha se relaciona, en general, solamente con la 
teoría de formas lineales y cuadráticas, así como con los elementos 
iniciales de la teoría de formas polilineales y del álgebra tensorial. 


Capítulo 1 Matrices 
y determinantes 


$ 1. Operaciones con matrices 


1.1. Matrices. Campo princip:«l. Los objetos principales de es- 


tudio en Jo sucesivo serán las matrices, los espacios lineales y los 
polinomios de varias variables, llamados también formas algebraicas. 
En la definición de cada uno de estos objetos participa un conjunto K 
de números o elementos de otra índole que debe ser previamente 
elegido. La elección concreta de K depende de los problemas que 
se resuelven y de la disciplina científica. Por ejemplo, desde el 
punto de vista algebraico los resultados obtienen la forma más 
completa, si K es el conjunto de todos los números complejos. Por 
el contrario, en la geometría y en la mecánica es preciso considerar 
generalmente los números reales, mientras que en la teoría de tos 
números resulta natural aceptar que K es el conjunto de los números 
racionales o, incluso, solamente el conjunto de los números racionales 
enteros. Para que los resultados puedan ser aplicados a un número 
de problemas lo más amplio posible conviene, por lo tanto, no fijar 
de antemano qué conjunto concreto se comprende por K. En algunas 
secciones será suficiente suponer que K es un anillo asociativo. 
En varios capítulos aceptaremos que K es un cuerpo conmutativo ar- 
bitrario o un cuerpo conmutativo arbitrario ordenado, mientras que 
varios teoremas importantes serán demostrados solamente en la supo- 
sición de que K es el conjunto de todos los números reales o el con- 
junto de todos los números complejos. Para las aplicaciones geomé- 
lricas y físicas son de mayor importancia precisamente Jos casos et 
que K es el cuerpo de los números reales o el cuerpo de los números 
complejos. 

Los elementos del conjunto K se llamarán números incluso cuando 
K sea un anillo arbitrario. Los representaremos por letras griegas 
minúsculas a, Pf, ..., T. 

Un sistema arbitrario de elementos del conjunto K dispuestos 
en forma de una tabla rectangular de m filas y de n columnas se 
denomina (m, n)-matriz o simplemente matriz sobre K. Para 
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representar una matriz, los símbolos que designan sus elementos suelen 
escribirse en el orden adecuado y la tabla obtenida se incluye entre 
aréntesis, corchetes o barras verticales dobles. Por consiguiente, 
a forma general de úna (m, n)-matriz será 


A Oj ..» Cp ¿A Org o. Aja a Ur .»-. Gr 
Agr Ag -.. Az X  Ueg o»... Eg Agr Reg +»... Ag 
, t 


A A A A E as. Cos bu 
donde «,, representan elementos de K. En vez de esta notación 
TER con frecuencia se emplea la notación abreviada: ||a;,|| o 
az! , A* 

Si el número de filas coincide con el número de columnas, la 
matriz se llama cuadrada y el número de sus filas, igual al de sus 
columnas, se llama orden de la matriz cuadrada. En particular, una 
matriz cuadrada de orden 1 es simple nente un elemento de K. 

Una matriz compuesta de una si la fila se llama simplemente 
fila y el número de sus elementos se denomina longitud de fila. 
En lo sucesivo las matrices serán representadas por letras mayús- 
culas latinas. 

Dos matrices se llaman ¿guales, si son iguales los números de 
sus filas y de sus columnas respectivamente y si coinciden los nú- 
meros que ocupan posiciones correspondientes en estas matrices. 
Por consiguiente, una igualdad entre dos (m, n)-matrices equivale a 
mn igualdades entre sus elementos. 

Las operaciones matriciales principales son: la multiplicación de 
un número por una matriz o de una matriz por un número, la 
adición y la multiplicación de dos matrices. Por definición, para 
multiplicar el número « por la matriz Á o la matriz A por el nú- 
mero a hay que multiplicar por «a todos los elementos de la ma- 
triz A. Por ejemplo, 


[ip = el le Al = [5 al 
a 4) ab ani' Len” lia ne]: 

Si las matrices se consideran sobre un anillo conmutativo K, es 
válida la igualdad «A == Aa para cualquier matriz Á y para cual- 
quier «€ K. En el caso de un anillo no conmutativo K puede re- 


sultar que «A + Aqu. Siendo K el anillo de todos los números 
enteros, tenemos, por ejemplo, 


2 3 2 3l ¿ _f10 15 
5-7 4-17 1]: = 35 L5)- 
La matriz, en la cual todos los elementos son iguales a cero, 
se llama matriz nula y se designa O. Si se quiere indicar de manera 


explícita el número de filas y de columnas de la matriz nula, se 
escribe Opa: 
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Está claro que para toda matriz A sobre K' y para cualesquiera 
a, PEK tienen lugar las relaciones: 

tl, 1-A=4- a 

2. 0-A=4-0=0; a-0=0-a=0. 

3. a (BA) =(aB) A; (Aa)$ =A (af). 

Se llama suma de dos matrices A y B de igual cantidad de 
filas y de columnas respectivamente una matriz con el mismo nú- 
mero de filas y de columnas, cuyos elementos son iguales a las 
sumas de los elementos correspondientes de las matrices A y B. 
Por ejemplo, 

2 1.3 + 0 2 —2]_[f2 3 1 
13.5 12 —s5| |2 —1 OJ' 

De esta definición se desprenden inmediatamente las relaciones: 

4, A+(B4+C)=(A4 B)+C; 

S. A+B=B+A; 

6. (a+PB) A=aA+BA; A(04-B)=Aa0+ AP; 

te red (A+ B)a= Aa + Ba; 

8. A40=0+A=A4,; 
la demostración queda a cargo del lector. En particular, empleando 
las propiedades 1 y 6, obtenemos 

A+ 4=24, A+FA+A=34, 

Introduciendo la notación (—1) A=-—A, tendremos también 
A+(-4)=0, (—a)A=—aA, —(A+B)=—A-—B, 
—(—A)=A4. 

Para abreviar, en lugar de Á-+(—8B) suele escribirse A—B. 
1.2. Multiplicación de matrices. Á diferencia de las operaciones 


de “adición y de multiplicación por un número, la operación de 
multiplicación de una matriz por otra se ee de forma más com- 
pleja. A saber, sean dadas dos matrices A y B, tales que el número 
de columnas de la primera coincide con el número de filas de la 
segunda. Si 


iy Tia +... On B,, B,, ... b,, 
Á= Cer ms «.» Os y B . Ba, Ba, ... B,, 
Lar A Lon Bn Ba Bnp 
la matriz 
Yu Yi «++» Yy 


Ya Var ---» Vep 


de 
Vas Ves <-> Yap 
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donde . 
Y, ¡=0% PB, +0 Pp + bi + AP) (i= l, . Mij= l, ..»p p), 
se denomina producto de A por B y se designa AB. Por ejemplo, 


a Bros. Jar+fh as+Ba ae +Bv 
a, B, H |-[areoa a6+Pp aje+Bv]- 
a Bo PL o lay+BA 05+B,pu aj -+Bpr 


La regla de multiplicación de matrices se enuncia, a veces, de la 
siguiente forma: para obtener el elemento, que se encuentra en la 
¡-ésima fila y ¡-ésima columna del producto de dos matrices, hay que 
multiplicar los elementos de la ¿-ésima fila de la primera matriz por 
los clementos correspondientes de la j-ésima columna de la segunda 
matriz y sumar los productos obtenidos. 

El producto de dos matrices, hablando en términos generales, 
depende del orden de los factores incluso en el caso en que el anillo 
K' es conmutalivo. Por ejemplo, 


lr 29f1 2 3 4 
ls Ll: 5]=15 8): 
1 211 2 7 6 
li lla 2|=|; 4)' 
Si se consideran matrices no cuadradas, puede ocurrir incluso 
que el producto de dos matrices tomadas en un orden tenga sentido 
y tomadas en el orden contrario, no lo tenga. 


Demostremos ahora las propiedades principales de la multipli- 
cación de matrices. 

9. a(AB)=(aA)B; A(aB)=(4a)B; (AB)a= A (Ba). 

Sean A =|| ¿lun Y B=1 Bye llnp. Para el elemento que se encuen- 
tra en la ¿-ésima fila y k-ésima columna de la matriz «(AB) 
(i=l, ..., mí; ksl, ..., p), obtenemos, empleando la regla de 
multiplicación de matrices, la expresión siguiente: 


aleBr +... +%imBnr)- 


Análogamente, para el elemento que se encuentra en la misma 
(-ésima fila y en la misma k-ésima columna de la matriz (a A) B, 
obtenemos la expresión 


(Uy) PBrñ+ ce. .+ (o ;,) Pur 


Como ambas expresiones coinciden, queda demostrada la primera 
de las igualdades 9. Con cálculos semejantes se demuestran las otras 
dos igualdades de 9, así como las propiedades: 


10. (A+ B)C=AC+ EC. 
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De las propiedades 10 y 11 se desprende directamente la siguien- 
te regla general): para multiplicar una suma de matrices por otra 
hay que multiplicar cada matriz de la primera suma por cada matriz 
de la segunda suma y sumar los productos obtenidos. 

Hemos visto que para el producto de matrices no se cumple la 
ley conmutativa: AB puede ser distinto de BA. Sin embargo, la 
segunda ley aritmética—la ley asociativa de la multiplicación — se 
cumple para la multiplicación de matrices”. 

12. A(BC) =(AB)C. 

Para la demostración tomemos 


AB=M y BC=N 


y representemos mediante pj, y vy los elementos de las matrices 
M y N. Según la regla de multiplicación de matrices tenemos 


By =P A LinParo 
Vy = BrYu y BjVes +... + BioY or 


donde a, Bya Y Ya son tos elementos de las matrices A, B y C. 
Efectuando la multiplicación de M por C, obtendremos en la ¡-ésima 
fila y (-ésima columna de la matriz (AB)C la suma 


BaYo HB Y FRY) A > 
RJ] 


Análogamente, efectuando la multipticación de Á por N, obtendremos 
en la ¿-ésima fila y (-ésima columna del producto A(BC) la suma 


CaYu E Li Ve +-.-+ CaVYal => NY ara 
f k 


Puesto que estas dos sumas difieren solamente en el orden de los 
sumandos, la fórmula 12 queda demostrada. 

De la fórmula 12 se deduce que el producto de varias matrices 
dispuestas en un orden determinado no depende de cómo se colo- 
quen los paréntesis. Por esto podemos hablar no sólo sobre el pro- 
ducto de dos matrices, sino también sobre el producto de un número 
mayor de matrices. Por ejemplo, podemos hablar simplemente del 
producto ABCD de cuatro matrices, ya que las cinco formas dife- 
rentes de calcular este producto 


(AB)CID, (A(BC)D, A((BCID), A(B(CD), (AB)(CD) 


llevan al mismo resultado. En efecto, cada producto siguiente sa 
obtiene del anterior aplicando directamente la ley asociativa 12. 


MPuesto que no se pueden sumar y multiplicar matrices arbitrarias, sino 
solamente aquellas en las que el número de filas y de columnas está sujeto a 
condiciones determinadas, las iguvaldades J0, 11 y 12 deben comprenderse de 
manera que sj las operaciones indicadas en uno de los miembros son posibles, 
las operaciones indicadas en el otro miembro también son posibles y los resul- 
tados obtenidos en ambos miembros coinciden. 


2—1843 
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Ya hemos señalado que cualesquiera dos matrices no pueden ser 
sumadas o multiplicadas, ya que para poder realizar estas operacio- 
nes es preciso que se cumplan determinadas relaciones entre los. 
números de filas y de columnas. Este inconveniente desaparece si 
se consideran solamente matrices cuadradas de un orden fijo *. 
Cualesquiera dos matrices de este tipo pueden ser sumadas o multi- 
plicadas, asi como multiplicadas por cualesquiera números de K, 
y el resultado será otra vez una matriz cuadrada del mismo orden rn. 
Las propiedades 1—12 indican que el conjunto de todas las matrices 
cuadradas de orden dado n sobre un anillo asociativo arbitrario K 
forman, a su vez, un anillo asociativo respecto a las operaciones 
matriciales de adición y de multiplicación. 

En lo que sigue aceptaremos que el conjunto numérico principal 
K es un anillo asociativo con el elemento unidad 1. La matriz 
cuadrada, en la que todos los elementos diagonales son iguales a | 
y los restantes son iguales a cero, se denomina matriz unidad y se 
designa mediante E o E,, donde n es su orden. Por consiguiente, 


1.0... 0 
el DIT 
0.0 1 


Efectuando el cálculo directo, es fácil obtener para cualquier matriz 
cuadrada A la igualdad 
AE=EA=A, 


que expresa la propiedad fundamental de la matriz £. Las matrices 
de tipo 


a 0 0 
o B 0 
00 ... y 


se denominan diagonales. 

De las reglas para las operaciones se desprende directamente que 
la suma y el producto de matrices diagonales son también matrices 
diagonales: 


a 0 ... 0 % 0 ,.. O a+ a, 0 ... 0 
06 ... 0[,JO0 fp, ... 0 e 0 B+P,  ... 0 

. . . . . Ll MI A O . o a , 
0 0 Y O 0 es 0 0 ... P+FY 
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na 0 ... 00 ¡2 0 ... 07 fax 0 0“ 
0B ... 0 ¡h Bo us 0 -| 0 BB... 0 
0 0 y L0 0 ... me Lo Vo... vpl 


Consideremos ahora una matriz cuadrada cualquiera X de orden 
n formada por elementos del anillo K. Por definición, tomamos 


X*=E, Xi=X, XA=XX, X*=XXX,... 


Puesto que en los productos de varías matrices los paréntesis 
pueden ser dispuestos arbitrariamente, tenemos para cualesquiera 


enteros no negativos p y q y para cualquier matriz cuadrada X 
sobre el anillo asociativo K 


XPX1=X"*2, (1) 
(X?)y = X?1. (2) 

Las matrices A y B se llaman conmutables, si 
AB= BA. (3) 


De la relación (1) obtenemos 
XPX9=XP+U= XI9XP, 


y, por consiguiente, todas las potencias naturales de una misma 
matriz son conmutables entre st. 

Es válida incluso una afirmación más general: sí las matrices 
A y B son conmutables, cualesquiera potencias naturales de las mis- 
mas también son conmutables y para cualquier p nalural se liene 


(AB)? = APBP, (4) 
En efecto, para cualesquiera naturales p y q se tiene 
APBIY= AA... AB... B. 


Por hipótesis, en este producto pueden ser permutados cualesquiera 
dos factores contiguos. Pero mediante permutaciones de este tipo 
los factores pueden ser dispuestos en cualquier orden y, en parti- 
cular, todos los factores iguales a B pueden ser llevados a las 
posiciones primeras. Análoyamente se demuestra también la fór- 
mula (4). 

Consideremos ahora un polinomio 


p(A)=%6, +0, A+... +0,” 


en la letra A, cuyos coeficientes pertenecen al anillo K. Si A es 
una matriz cuadrada sobre K, la expresión 


aAEFSa A+... +0, A” 
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se denomina valor del polinomio p(A) para A= A o, brevemente, 
polinomio correspondiente en Ja matriz A. Suponiendo que el anillo 
K es conmutativo, llegamos fácilmente a la conclusión de que el 
valor de una suma de polinomios en A para A=AÁ es igual a la suma 
de los valores de los sumandos y de que el valor de un producto de 
Pos es igual al producto de los valores de los factores. 

an 


PA)=2 +A PRA, 
v()=P Bid... +B,2”. 
Entonces, 
FO) =90+9() =(0 +B) +0, +B JAS. +04 BA" 
EM) =P) p(A) =0B, + (2B +4 APA RH. +2 P, A”. 
Nuestras afirmaciones consisten en que 
FA) = (4) +14), 
g (4) =p (A) y (A). 


Para la demostración es suficiente escribir las expresiones para 

(4), v(4). F(A) y £(4) y siguiendo las reglas 1—12 del cálculo 

matricial efectuar la adición y la multiplicación de y(4) y y(4). 
A título de ejemplo consideremos la igualdad 


4—1=(A—1)(4 +1). 


Tomando los valores del primero y segundo miembro para 4¿=A4, 
obtenemos la igualdad matricial 


A —E=(A—E)/NA+E). 
De manera análoga de la igualdad 
Ap1=A+1)4t—iA+1) 
obtenemos la relación 
4 HE =(A+E) (4*— A+ E). 


En general, de esta forma se puede obtener de toda relación entre 
polinomios en A una identidad matricial. En particular, según las 
reglas de operaciones con polinomios, se tiene 


PA) y (A) =p (4) p (4). 
Tomando aquí en lugar de A una matriz cuadrada A, obtenemos 
PLA) DIA) =v (4) p (4). 


Por consiguiente, los polinomios en una misma matriz son conmu- 
tables. 
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1.3. Transposición de matrices. Consideremos una matriz arbi- 
traria 


Ar Gm... a 
A Ca UU 
== 
Um Ora Sen Lan - 
La matriz 
TC 
Lg Goy .-- Am 
A" pa e 13 . e o e e a 
Cn er ++ Cn E 


que se obtiene de A al cambiar las filas por las columnas, se llama 
transpuesta respecto de Á. En lo sucesivo la raya siempre indicará 
el paso a la matriz transpuesta, 
Para dos matrices arbitrarias A y B tienen lugar las siguientes 
reglas de transposición: 
(CA+PB) =2a04'+PBB", 
(ABy =8B'4A", 


donde a y B son números cualesquiera. Demostremos, por ejemplo, 
la segunda de estas igualdades. El elemento, que se encuentra en 
la ¿-ésima fila y j-ésima columna de la matriz (AB)', es igual al 
elemento que aparece en la j¡-ésima fila e ¿-ésima columna de la 
matriz AB, es decir, es igual a 


Bru +0Ba +... +0 Bat 


donde a;, y P,, son los elementos de las matrices A y B. Pero esta 
expresión es la suma de los productos de los elementos de la ¿-ésima 
fila de la matriz B' por los elementos correspondientes de la ¡-ésima 
columna de la matriz A”; es decir, (AB) =B'A". 

Si A es una matriz cuadrada cualquiera y 


A'=A, 
se dice que Á es simétrica; en cambio, si 
A =—A, 


se dice que Á es antisimétrica. Los elementos simétricos respecto 
de la diagonal principal coinciden en una matriz simétrica y son 
opuestos en una matriz antisimétrica.'En particular, todos los ele- 
mentos diagonales de una matriz antisimétrica son iguales a cero. 

De la regla de transposición de una suma se deduce directamente 
que la suma de matrices simétricas es una matriz simétrica y que 
la suma de madrices antisimétricas es una matriz antisimétrica. El 


22 Cap. /. Matrices y determinantes 


producto de matrices simétricas puede no ser una matriz simétrica; 


por ejemplo, 

1 2] f2 1 4 3 

2 3) l1 1J= (7 Ss): 
Sin embargo, si dos matrices simétricas A y B son conmutables, 
el producto también será una matriz simétrica. En efecto, en este 


caso se tiene 
(ABy =B'A4'=BA=AB. 


De aquí se deduce que las potencias de una matriz simétrica son 
matrices simétricas y que los polinomios en una matriz simétrica 
también son matrices simétricas. 

Una matriz cuadrada A sobre el anillo K se llama invertible 
(sobre K), si existe una matriz cuadrada X sobre K, que satisfuce 
las relaciones 


AX =XA=E, (1) 


Toda matriz X que verifica las condiciones (1) se denomina 
matriz inversa de Á O inversión de la matriz A. Para toda matriz 
invertible A existe solamente una inversión. En efecto, si además 
de la matriz X hay otra matriz Y que satisface las condiciones (1), 
multiplicando a la izquierda por X ambos miembros de la igualdad 


AY =E, 
obtenemos 


o Y =X. 
La inversión de la matriz A, si es que existe, se designa me- 
diante A—!. Es decir, por definición, 
A AT1=A7"!.A=FE. (2) 


En las condiciones (1) Jas matrices A y X figuran simétrica- 
mente y, por ello, si X es la inversión de A, A es la inversión 
de X; en otras palabras, 


XA-Y =XE 


(A71y7"1=A. (3) 
Si las matrices cuadradas A, B y C son de un mismo orden e 
invertibles, su producto ABC también es invertible y 
(ABCy* =C-"1B24A”*, 


es decir, la inversión de un producto de matrices es igual al pro- 
ducto de las inversiones de los factores tomado en el orden contrario. 
Para la demostración es preciso comprobar las igualdades 


ABC.CAB-A7t=C-1B-1A71.ABC=E, 


$ I. Operaciones con matrices 23 


que son consecuencias evidentes de las relaciones (2) y de las rela- 
ciones análogas para las matrices B y C. 
Para toda matriz invertible A, además de sus potencias natu- 


rales A*=E, Al=AM, A?=AA, ..., se consideran también sus 
potencias negativas enteras, tomando por definición 
ATIZACTIASL, ATRSZATAIASS ... (4) 


Las potencias fraccionarias de matrices se consideran raramente, 
debido a que en muchos casos las definiciones corrientes no ofrecen 
valores univocos para estas potencias (véase el p. 16.2 del cap. IV). 

De las relaciones (2) y (4) se deduce que para cualquier matriz 
invertible A y cualesquiera números enteros (no necesariamente po- 
sitivos) p y q tienen lugar las reglas comunes de operaciones con 


potencias 
APA? = Ar+9, 
(AP) = AP, 
y además, si las matrices Á y B son invertibles y AB=BA, se 
tiene 
(ABYP = APBr, 
Veamos ahora la relación que existe entre las operaciones de 


transposición e inversión. Aplicando a las relaciones (1) la regla de 
transposición del producto de matrices, obtenemos 


XA == X'=E, 


es decir, a] transponer una matriz invertible A se obtiene de nuevo 
una matriz invertible y 


(AM7i= (AS. * (5) 
Una matriz cuadrada Á se llama ortogonal, si 
AA'=A'ASE, (6) 


es decir, si la matriz transpuesta es inversa de la inicial. De aqui 
se deduce, en particular, que toda matriz ortogonal es invertible. 
Puesto que (A) = 4, de (6) se deduce que la inversión de una 
matriz ortogonal es una matriz ortogonal. 
Además, si las matrices A y B son ortogonales, se tiene 


A'"=A7!, B'=B"' 
y, por consiguiente, 
(ABy =B'4'=B"A"'* =(AB)”". 
En otras palabras, el productu de matrices ortogonales es una 
matriz ortogonal. 


Consideremos una operación matricial más. Sea A una matriz 
arbitraria, cuyos elementos son números complejos. Sustituyamos 
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en Á todo elemento por el número complejo conjugado. La matriz 
obtenida por este procedimiento se llama conjugada compleja de A 
y se designa por A. La operación consistente en el paso a la matriz 
conjugada compleja posee las propiedades siguientes: 


cA+PBB=a4+BB, 
AB=AB, 
4'=(A), 
A71=(A)”; 


la demostración es muy sencilla y queda a cargo del lector. 
Las matrices A y A” se denominan conjugadas según Hermite?). 


Si A=A", la matriz A se llama hermitiana o simétrica según Her- 
mite. 
Una matriz A que satisface la relación 


AA=AA'=E, 
se llama unitaria. 

Se puede demostrar, por el mismo procedimiento que el empleado 
para las matrices ortogonales, que la matriz inversa de una matriz 
unitaria es unitaria y que el producto de matrices unitarias es tam- 
bién una matriz untlarta. 

Si todos los elementos de la matriz Á son números reales, se 


tiene A=A y, por consiguiente, para las matrices reales los con- 
ceptos de simetría y de simetría según Hermite, así como los de 
matriz unitaria y de matriz ortogonal, coinciden. 


1,4. Matrices celulares. Dividamos una matriz A en partes me- 
diante un sistema de rectas verticales y horizontales. Estas partes 
pueden ser consideradas como matrices de órdenes inferiores que 
forman, interpretadas como elementos, la propia matriz; se deno- 
minan células, calas o bloques de la matriz A, mientras que la propia 
matriz Á, dividida de un modo determinado en células, se deno- 
mina, respectivamente, celular, de caja o de bloque. Una misma 
matriz puede ser dividida en células de diferentes maneras; por 
ejemplo: 


1 87 6 1 8 76 l 87 6 
350 21, [3.5 02|, [350721 
| 49 3 14 9:3 1 4973 


La conveniencia de la división en células consiste en que las 
operaciones principales sobre matrices celulares se realizan formal- 
mente siguiendo las mismas reglas que en el caso de matrices co- 


1) En et capitulo V estas matrices se llaman también conjugadas transpuestas 
o anticonjugadas (N. del Tr.) 
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rrientes. En efecto, supongamos una matriz A dividida de algún modo 
en células: 


Al multiplicar todas las células por un número « multiplicaremos, 
al mismo tiempo, todos los elementos de la matriz A por a. Por 
consiguiente, 


Sea B una matriz dividida en el mismo número de células que 
la matriz A: 


Supongamos, además, que las correspondientes células de las matri- 
ces A y B son del mismo número de filas y de columnas respecti- 
vamente. 

Para sumar las matrices A y B hay que sumar, según la defi- 
nición, sus elementos correspondientes. Pero lo mismo ocurrirá, si 
sumamos las células correspondientes de estas matrices. Por esto 


Aut+B, AntBn ... 00 


o III 
Am + Bas Ámo + Ba Na Ann + Ban 


La situación es menos evidente en el caso de la multiplicación. 
Consideremos las matrices 


divididas en células U,, y V,, de manera que el número de colum- 
nas de la célula U,, sea igual al número de filas de la célula 
Vali=1,...,Mm; I=1,...,n; Ri=l, ..., p). En estas condiciones 
las expresiones 


1d 


W,¿=0 Vi tONVue+... FUN nr 
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tienen sentido. Es fácil demostrar que 
Y AS W., 


UV=| -....-. 1], (1) 
Wa Wo 


es decir, las matrices divididas de manera adecuada en células pue- 
den ser multiplicadas de la forma corriente: las células del producto 
son iguales a las sumas de los productos de las células de las filas 
de U por las células correspondientes de las columnas de V. 


Demostremos primero esta regla en el siguiente caso particular: 


(48) [p) = AC + 8D. (2) 
Sean Ary Pix, Yys y On, los elementos de las matrices A, B, C y D respectiva: 
mente (I=ft, ..., Mi f=l, ..., A; k=1l, ..., $, l=1, ..., 1). Efectuando las 


operaciones indicadas en el primer miembro de la igualdad (2), obtendremos que 
el clemento que se halla en la ¡-ésima tila y /-ésima columna es igual a 


aaYu ++ nn Bndu+---+BisOst 


Por otra parte, calculando el elemento correspondiente del segundo miembro, 
pri la misma expresión y, por consiguiente, la igualdad (2) queda de- 
mostrada. 

Empleando la fórmula (2), es fácil demostrar ahora una fórmula más genera! 


B, 
B 
[AJÁs -- Anl| :" [=418,+41B,+...+4AnBn, (3) 
Ba 
donde Á; E son células. Para n=2 esta lórmula coincide con (2). Apliquemos 
ión. 


Ja induce es ue para los valores de n menores que un valor dado 
la fórmula (3) ha sido ya demostrada y sea 


B, 
C=|[A, ... An), D=| : |. 
Bn 


En este caso de (2) obtenemos 


B, 
B, B; 
[A1Ar - Anj] -* [m=(4,c] Lo ]=418,+0D=4,B,+45B,+...+4AnBp: 
Ba 
De manera análoga se obtienen las lórmulas 
A(8, 8, ... Bal=(AB, AB, ... AB), (4) 


0 
.* B=| +” >. (5) 


An A,B 


Para deducir ahora de las fórmulas particulares (3), (4) y (5) la fórmula general (1), 
designemos mediante U,, ..., Un las filas de células de la matriz U y mediante 
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Vi» ».., Vp las columnas de célules de la matriz Y. En base a la fórmula (5) 


tenemos 
U, UV 
or lr ! | 
Un U Y 


Tomando aquí en lugar de la matriz V su división en células [V, ... V,] y em- 
pleando la lórmula (4), obtenemos 


UY, ..- UV, 
UVel........ : (6) 
Por otra parte, en virtud de (3) tenemos 
Via 
UNV4=[Un -.. Un | : |=U5Vr+.- FU inV n= Win. 
Var 


Colocando estas expresiones en (6), obtendremos la fórmula (1). 


En el caso de matrices cuadradas resulta necesario, como regla 
general, dividirlas de manera que las células diagonales también 
sean cuadradas. Es fácil ver que, divididas dos matrices cuadradas 
en células de manera que las células diagonales sean cuadradas 
y que los ordenes de las células diagonales correspondientes coinci: 
dan, esta división satisface tanto las condiciones en las que es po- 
sible la adición célula por célula, como las condiciones que son 
necesarias para poder multiplicarlas como matrices celulares. 

Toda matriz celular de tipo 


CA, 0 ... O 
AS O A, ... O 
A ES pa dl 
donde A,, ..., A, son células cuadradas y O son matrices nulas 


de dimensiones adecuadas, se llama matriz celular diagonal. En el 
mismo sentido se dice también que A se descompone en partes 
...y A, O que Á es la suma directa de las matrices A,, . : 


1 a ..) Ss 
simbólicamente 


A=A FA,+...+As. 


Las operaciones con matrices descompuestas se reducen a las 
operaciones con sus células diagonales. De aquí, a su vez, se des- 
prende que siendo f(A4) un polinomio y A una matriz celular 
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diagonal de células diagonales A,, ..., A,, se tiene 
HA) A 
FA) 
a) = e V (7) 
L HAN] 


1.5. Cuaternios. Las matrices constituyen un instrumento có- 
modo mediante el cual se pueden construir a partir de un anillo 
dado, por ejemplo, del anillo de los números reales, anillos de 
estructura más compleja. De forma sistemática este problema se 
estudia en la teoría de anillos y nos vamos a limitar a considerar 
solamente dos casos particulares. 

Consideremos el anillo R, de todas las matrices cuadradas de 
segundo orden sobre el cuerpo R de los números reajes. Tomemos 


_[pL0 0 —] 
Sea C el conjunto de todas las matrices de R, de tipo 


aE+p=[5 El (0.BER) (1 


Elevando al cuadrado la matriz /, obtenernos /*=--E y por ello 
las operaciones con las matrices (1) se pueden efectuar siguiendo 
las fórmulas 


(LE +B/) + (YE +51) =(a < y) E +(B + 6) 1, 
(aE + BI) (YE + 6/1) =(ay —P0) E + (a6+ By) /, 
es decir, las mismas fórmulas que para los números complejos a +- Bi 


y y+6i. De las fórmulas señaladas se deduce también que el con- 
junto de matrices C es un anillo y que la correspondencia 


aE +81 — a + Pi 
es una aplicación isomorfa del anillo C sobre el anillo de todos los 
números complejos. 


A partir de las matrices de segundo orden E e / construimos 
ahora cuatro matrices cuadradas de orden d: 


52. (223. 9) [22.0 


La matriz e es la matriz unidad corriente de orden 4 y, por 
ello, 


e=ie=ail, e =oje=,], *R=ke=kR, (3) 
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Multiplicando las matrices (2) según las reglas de multiplicación 
de matrices celulares y teniendo en cuenta que /*%=-—+£, obtenemos 


li=k=— fl, ¡kai=—k]), ki=/=—ik (4) 

y, además, 
A=epp=ke —e. (5) 
Es fácil memorizar las fórmulas (4): significan que en la se- 
cuencia i, j, k, i, j, R el producto de dos elementos consecutivos 


es igual al elemento que les sigue. 
Las matrices de tipo 


a —y —B —ó 
ce+Bi+v/+6r=] 8 _5 . : (6) 


6 B—p ay 
donde a, P, y, 9 son números reales arbitrarios, se llaman cua- 
ternios (o, a veces, matrices cuaternios). De (6) se deduce que la 


representación de los cuaternios en la forma «uc + Bi + y + ÓR es 
unívoca. En otras palabras, la relación 


et Bl yj+ók=0,0+Bj + Y, ¡+61 
equivale a cuatro igualdades: 
==,» B=8B,, YY. S == Ó,. 


La adición y la sustracción de los cuaternios, representados 
en la forma algebraica normal ae +Pi+ yj + 5k, se realiza por la 
regla corriente: 


(ae + Bi + yj + 6) + (a, + Pt + y,) + 5,h) = 
= (0 +0)e+ (BB) + (ri) 1+(6806,)2. (7) 


Para multiplicar dos cuaternios, representados en la forma 
algebraica normal, es suficiente recurrir a la ley distributiva y a 
las tablas de multiplicación (3), (4) y (5). Como resultado llegamos 
a la fórmula 


(ae + Bi + y] + ÓR) (ae + Br vi j + 51%) = 
= (ac, —PPB, —yy,—65,)e + (098, + Ba, + y6, — Óy)i + 
+ (ay, + ya, + 5p, —BÓ,) ¡ + (20, + 6%, + By, —1B) E. (8) 


Las fórmulas (7) y (8) muestran que el conjunto Q de los 
cuaternios matriciales es un anillo con unidad e, que constituye 
un subanillo del anillo de todas las matrices reales de orden 4. 
Los cuaternios e, £, j y R suelen llamarse cuaternios unidades. De 
las relaciones (4) se deduce que el anillo de los cuaternios es no 
conmutativo. El hecho más notable consiste en que el anillo de 
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los cuaternios es un cuerpo, es decir, que en el anillo de los cua- 
ternios pueden ser resueltas todas las ecuaciones de tipo 


ax=b, ya=b, (9) 


donde a y b son cualesquiera dos cuaternios dados, de los cuales a 
es diferente de cero. Más abajo se dan unas fórmulas cómodas 
para la solución de estas ecuaciones. 

Consideremos un cuaternio cualquiera 


q =ae + Pi+ y] +5k. 
El número real 


N (q) =0% + 149469 


se llama norma del cuaternio q. Puesto que «a, B, y y 6 son núme- 
ros reales, la norma de un cuaternio es un número real no negativo 
e igual a cero sólo para el cuaternio nulo. 

El cuaternio 


q” =ae—Bi—y/—6k 
se denomina conjugado de q. Es claro que g*”=qg. Mediante la 
multiplicación directa de los cuaternios q y q* (según la fór- 
mula (8)) se obtienen las igualdades principales 


ar =q% =N (q)-e, 


de donde 

A T=" (10) 
O 

EN (11) 


(siempre que q 0). 
Volvamos ahora a las ecuaciones (9). Multiplicándolas por a”?, 
la primera por la izquierda y la segunda por la derecha, obtenemos 


x=a"%b, yeba”!. (12) 


Con la sustitución de estos valores en las ecuaciones (9) se demues- 
tra que las jórmulas (12) ofrecen efectivamente las soluciones 
buscadas de estas ecuaciones. 

En el caso general las soluciones a”'b y ba”* son distintas. Por 
esto suelen llamarse cocientes por la izquierda y por la derecha 
de b por a, designándose mediante ab y b ya, respectivamente. 
Efectuando el cálculo directo, es fácil demostrar las fórmulas 


(an + POy* = av” + Bor, 
(aby =b*a*, 


Ejemplos y problemas 31 


- de donde es fácil deducir la importante relación 
N (ab) ==N (a) N (b) (a, bE Q). 

En efecto, 

N (ab) -e =abb*a" = aa (b) = N (a) N (b) e. 

La aplicación a -—ae es un isomorfismo del cuerpo (conmuta- 
tivo) de Jos números reales en el cuerpo de los cuaternios. Esto 
permite identificar un cuaternio de tipo ae con el número a y en 
lugar de ae+Bi+y!/+0% escribir simplemente «a+ PBi+ yi + 6%. 
Así, por ejemplo, se tiene 


E E e 


La mayor parte de los resultados de las secciones siguientes 
del libro estará relacionada con des cuya definición depende 
de un cuerpo K dado de antemano. Aunque tendrán interés princí- 
pal los casos en que K es un cuerpo conmutativo, los razonamien- 
tos se realizarán de manera que no quede excluido el caso de 
cuerpos no conmutativos. Al analizar estos razonamientos conviene 
tener en cuenta que el cuerpo K puede ser precisamente el cuerpo 
de los cuaternios Q. 


Ejemplos y problemas 


]. Sean 
p (4) =-—2—54+4-31% y A=|, 1) 
entonces 
o" ,| 
3 14 


2. Demuéstrese que la matriz 


u=[? a] 


es piba ¿Bajo qué condiciones una matriz diagonal resulta ser ortogonal? 
unilaria 
y 3. Hátlese fa inversa de la matriz 


2 2 1 
A=|3 1 | 
2 


13 3 
4. Si e 
Fl 1.0 
Ara] 0 51 1l, 
10 9 1: 
se tiene 


e In ya!) 
e IA . 


00 1 Jj 
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5. Demuéstrese que todas las matrices conmutables con  . 
0100 
0010 
0001 
0000 


Az 


son de tipo ie 
af y 09 
0ab y 
00a8B 
0000) 


6. Si una matriz posee dos de las tres propiedades siguientes: es real. es 
ortogonal, es unitaria, posee también la tercera. 

. Toda matriz cuadrada puede ser representada como la suma de una ma- 
triz simétrica y otra antisimétrica. 

8. Una matriz / se llama (nvolutiva, sí /1=E. Demuéstrese que si una 
matriz posee dos de las propiedades: es simétrica, es ortogonal, es tnvolufiva. 
posee también la tercera. 

Fo Una matriz P se llama idempotente, sí Pt=P. Demuéstrese que las 
matrices 


B= 


—26 —18 —271 100 
21. 15 21[y|010 
12 8 13] 000 
son Idempotentes. 
10. SL P es idempotente, la matriz 
l m2P—E 
es Involutiva y viceversa, si / es involutiva, la matriz 


P=>3(1+E) 


es idempotente. 

11. Consideremos las matrices cuadradas de orden n. Sea F;¡, (ft, J=1, ..., 
.»., A) la matriz en la que el elemento de la ¿-ésima fila y /-¿síma columna cs 
igual a 1, mientras que los demás elementos son iguales a 0. En estas condi- 
clones, para A =[J «¿y [| se tiene 


A «E¡¡m03 ¡Ey + ... +Un ¡Enf 
E¡y:A =21É€;/) +... +apmÉ ¡n- 


Dedúzcase de aquí que la matriz A es conmutable con cada una de las 
matrices Ej, sl, y sólo si, Á es de la forma «E. 

Empleando este resultado, demuéstrese que la matriz A es conmutable con 
una matriz cualquiera cuadrada de orden na si, y sólo sl, Aw«aE, donde a es 
un elemento del anillo principal K conmutable con cualquier elemento de K. 

12. A veces, además de matrices de orden finito, se consideran también 
Ari de orden infinito que tienen la forma de una tabla infinita de dos 
entradas: > 


A1y Bra »-- 
A=| 051 Us ... |: 
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Una matriz de este tipo se llama finita en fila, si cada una de sus filas 
contiene solamente un número finito de elementos diferentes de cero. Las opera- 
ciones con las matrices finitas en fila (asi como con las matrices finitas en 
columna, que se definen análogamente) se renlizan siguiendo las mismas reglas 
que tienen lugar en el caso de matrices cuadradas de orden finito. Es fácil ver 
que el resultado es de nuevo una matriz finita en fila. 

Sea A=/]a;, [| una matriz de orden infinito tal que 1=0a,¿=Ug7=2... 
y Csy== 0 pare 1—s 3 |. Demuéstrese que AA'=E y AYA HE. 


$ 2. Determinantes 


2.1. Definición. El concepto de determinante surgió en relación 


con el problema de solución de sistemas de ecuaciones lineales. 
Tornemos un cuerpo conmutativo K y consideremos sistemas ele- 
mentales de ecuaciones de primer grado de dos y tres incógnitas 
y con coeficientes de K. Un sistema de dos ecuaciones lineales con 
dos incógnitas $, y E, se representa en la forma siguiente: 


2, +01, =B,, (1) 


02161 + Az252 = Pa, 


donde «;, y B, son números de K dados. Las matrices 


Alan] y alan dep] 


se llaman matriz principal y matriz ampliada, respectivamente, del 
sistema (1). Con el fin de eliminar la incógnita E,, multipliquemos 
la primera ecuación por «¿, y la segunda por —«a,. y sumemos 
ambas. Obtendremos la ecuación 


(%, Lg —%1 1% 1) 5, = P¡% 1 —P,%2%1- 


Si 0,,%y — 3%, 720, obtenemos de esta ecuación y de una ecua- 
ción análoga que se obtiene eliminando E, 


E, = 232), —a:12B2 E,= aaP.—29Br (2) 


1] 1] 
%¡1%93A]2U 71 11% —A]72%g1 


Los denominadores de las expresiones de las incógnitas E, y €, 
coinciden y representan un polinomio en los elementos de la matriz 
principal A. El valor de este polinomio se llama determinante de 
la matriz A y se designa det A o | A]. Si la matriz viene dada 
por su tabla, el determinante se designa escribiendo la tabla entre 
barras verticales. 

Es decir, por definición para cualquier matriz cuadrada de orden 
dos se tiene 


A > 
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Empleando Jos determinantes, la fórmula (2) puede ser escrita 


en la forma ] : 
1 Gu Pr 
ee ls, el — Lu B, 
Es as ls 217]? Es ls Ayo | (4) 
Za zz Agr Laz 


Resolviendo de forma análoga el sistema de tres ecuaciones 
Am, + A 953 A Arba pS B,, 
Aqyór + quiz + gas = Ps, (5) 
23151 + LagEs + 26, = Ba 
con tres incógnitas E,, E, y E,, obtenemos 
E = B,%j2%a1 — Ba + Pr — Paga + Bar Lan — Po 291 9 (6) 
1 11%319%39 Ay 12339 + ¡999291 — 19% 21% 33 + 19712 — A13%2 2% 51 
y unas expresiones análogas para E, y E,. Por supuesto estas expre- 


siones tienen sentido sólo en el caso en que su denominador sea 
diferente de cero. Las matrices 


Er ig Ly Ly % y Uy P, 

A=| 05, % y Gal y B=|%, %3 Los Ba 

Ag Azgg gy Ag Aga Aga Bs 
también se llaman matriz principal y matriz ampliada del sistema 
de ecuaciones (5). El denominador de la fórmula (6) se llama de- 


terminante de la matriz cuadrada 4 de orden tres. Luego, por de- 
finición, 


Aj Ey La 
gr Aga Aya 
yy gg Ag 


== (1% Ay, — L, ¡OgyOlgz + Ag ag Ay — AA ga Tr. 
Ly %gz — Uy 9% gy gr (7) 


Uniendo en el segundo miembro los términos que contienen a,,, 
Ar Y %), y recordando la fórmula (3), obtenemos 


yy Aa % 


O Mes Aza 


=0), 1 q], A) Aya 
Ag, Age Azg 


(% 0 4 
+ UA, | 21 23 
32 33 : 31 33 


Cs Aga 


(8) 


Es fácil memorizar la fórmula (8). Para abreviar, en lugar de 
determinante de una matriz de orden dos o tres suele decirse deler- 
minante de segundo o tercer orden. Los tres determinantes de segun- 
do orden de la fórmula (8) se obtienen suprimiendo del determi: 
nante del orden tres, que figura en la misma fórmula, la primera 
fila y, respectivamente, la primera, la segunda y la tercera columna. 
A continuación, el determinante de segundo orden que se obtiene 
suprimiendo la primera fila y la ¡-ésima columna dehe ser multi- 
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plicado por el elemento que se halla en la primera fila y en la /-ési- 
ma columna y los productos obtenidos deben ser tomados con signos 
alternos y sumados. Como resultado obtendremos el determinante de 
orden tres. 

Esta regla nos sugiere la idea de cómo debe ser definido el con- 
cepto de determinante de una matriz cuadrada de orden cuatro, 
cinco y de órdenes superiores. Por lo tanto, introducimos la sigui- 
ente definición principal: 

DEFINICIÓN. Se llama determinante de una matriz de primer or- 
den, formada por el número a, el propio número a. Supongamos 
ahora que para un número natural cualquiera n > 1 conocemos ya el 
elemento del anillo K que representa el determinante de una matriz 
arbitraria cuadrada de orden n sobre K. Entonces, para una matriz 
cuadrada arbitraria A=||a,,|| de orden n +1 sobre K tomamos, por 
definición, 


det || «,, || =0,, | A1|—2,3] A+ an lA... HA Al, 
(9) 


donde | A,] es el valor del determinante de la matriz de orden n que 
se obtiene de la matriz inicial A suprimiendo la primera fila y la 
¡-ésima columna (¡=1, ..., n+1). 

Aplicando esta definición en el caso en que rn=l, obtenemos 
la fórmula (3) para determinantes de orden dos. Conociendo la ex- 
presión para los determinantes de orden dos, pocos emplear 
la definición principal para obtener la expresión (8) para los deter- 
minantes de orden tres. De la expresión (8) obtenemos mediante (3) 
la fórmula definitiva (7). 

Veamos ahora cuál es la fórmula definitiva para los determi- 
nantes de orden cuatro. De acuerdo con la definición principal, el 
determinante de una matriz cuadrada arbitraria A =||«,,|| de orden 
cuatro coincide con la expresión 


Oya Aya Ha 
qa yy gy 
Usa Aga ae 


ar es Cra 
%g Laa Tas 
Aa Ass Ka 
oy Age Uy 
Ag gy Aza 
As Ear Ha 


gy Aga Bes 
Ay] Aza Aza 
sr Zea Los 


1 + Uy e 


— rs 


— Oe (10) 


Introduciendo aquí las expresiones de los determinantes de orden 
tres según la fórmula (7) y suprimiendo los paréntesis, obtendremos 
la fórmula definitiva que buscabamos para un determinante de 
orden cuatro. No la escribiremos puesto que no tiene sentido memo- 
rizarla. Según (7) tudo determinante de tercer orden es igual a la 
suma de seis términos tomados con signos alternados. Por eso, si 


ye 
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tomamos en (10) en lugar de los determinantes de orden tres sus 
expresiones y suprimimos los paréntesis, obtendremos en total 4.6 = 24 
términos. La mitad de ellos aparecerá con el signo más y la otra 
mitad con el signo menos. Una afirmación análoga es válida también 
para los determinantes de orden cualquiera. 

TEOREMA 1 Para una matriz cuadrada arbitraria se tiene 


E E 


Ant te... Con 


donde la suma se extiende a las permutaciones arbitrarias (i,, iq, ..., 1,,) 
de los números 1, 2, ..., n. El signo más o menos se toma según 
sea par o impar la permutación (i,, la ..., [,), es decir, en la 
mitad.de los casos se toma el signo más y en la otra mitad se toma 
el signo menos, el número total de términos en la suma (11) es ¡igual 
a Lia n=nil. 

Para n=1, 2, 3, 4 la veracidad del teorema ya ha sido com- 
probada. Ahora aplicamos la inducción. Supongamos que el teorema 
es cierto para los determinantes de un orden cualquiera n y sea 
As=|la,,|]| una matriz cuadrada de orden n+ 1. Por hipótesis, cada 
de inante 1AL| (=1, ..., n+1) de la fórmula (9) es de ta 
orma: 


= Y) +0,¿%,,- TT (11) 


| Al | => y E Arm Aza, * > Are 1, Min» (12) 


donde la suma se extiende a todas las permutaciones (m,, ..., m,) 
de los números 1, ..., j—1, ¡+1, ..., 1+1. El número de tér- 
minos en la suma (12) es igual a n!. Sustituyendo en (9) | A4/| por 
sus expresiones y suprimiendo los paréntesis, obtendremos un total 
de n!(n+1)=(n+1)! términos. La mitad de ellos tendrá el signo 
más y la otra mitad el signo menos. No habrá términos semejan- 
tes, puesto que los términos que se obtienen al suprimir distintos 
paréntesis difieren en el primer factor. Es evidente que el término 
arbitrario de tipo G,¡Ag;,. - -La+r.ipy, Se Obtiene al suprimir los pa- 
réntesis en el producto x2,; | Af' | y, por consiguiente, la fórmula (11) 
es verídica. 

De la fórmula (11) se puede deducir fácilmente el siguiente 
corolario importante. Supongamos que los elementos de la matriz 
A=lla,,l] son números complejos. En virtud de la fórmula (11), 


tenemos 
| Al=Y+a,,.. Ani = Y Ei, . Gai, =| Al, 


es decir, 
4] =[AT. 


Según la fórmula (11) el valor del determinante de una matriz 
es igual a una suma algebraica de términos, cada uno de los cuales 
es el producto de elementos, tomados de manera que haya uno de 
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cada fila y uno de cada columna. Por ello, si todos los elementos 
de una fila o de una columna de la matriz son iguales a cero, tam- 
bién serán iguales a cero todos los términos del determinante. Es 
decir, hemos obtenido el siguiente corolario: 

COROLARIO. Si una fila o una columna de una matriz cuadrada 
está compuesta integramente por ceros, su determinante es igual a cero. 

Una matriz cuadrada se llama semidescompuesta, si sus elemen- 
tos pueden ser divididos mediante una línea vertical y otra hori- 
zontal en cuatro matrices de manera que a lo largo de la diagonal 
figuren matrices cuadradas y una de las otras dos matrices esté 
compuesta integramente por ceros. En otras palabras, la matriz A 
es semidescompuesta si tiene una de las dos formas siguientes 


a %m ... Ar tr. r+1 «e... q 


Ey ci Er a, e | a An 
, 
0 ..o 0 rr r+1 ... . A 
0 .... 0 Oo. +1 .... e 
a 1 060. 1.1. Asp 0 e. ... 0 A 
Art . . A, 0 e... 0 
TN NT ll 
Ar ns Car An, PR! am Cor q: 


A veces, la primera de estas matrices suele llamarse matriz se- 
midescompuesta superior y la segunda, matriz semidescompuesta 
inferior. 

TEOREMA 2. El delerminante de una matriz semidescompuesta es 
igual al producto de lus determinantes de sus células diagonales. 

Para una matriz de orden dos esta proposición es evidente, ya que 


a B a 0 
Apliquemos ahora la inducción aceptando que el teorema 2 es 


cierto para las matrices de un orden cualquiera r—1. Consideremos 
una matriz arbitraria semidescompuesta A de orden s». Supongamos 


que es de la forma 
B D 
A =/|a,, 1] = O,, C , 


donde B y C son matrices cuadradas de orden r y s respectiva- 
mente (r +s=n) mientras que O,, y D son matrices rectangulares 
y la matriz O,, es nula. Aplicando la fórmula (9), obtenemos 


| A | = 0, | Aj|—a2] A+ ... + (— 1374, 1 Atl, (13) 
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donde | 4, | es ta matriz de orden n— 1 que se obtiene suprimiendo 
en A la primera fila y la ¡-ésima columna. Es fácil ver que todas 
las matrices Af son semidescompuestas y, por cjlo, según la supo- 
sición inductiva, el determinante de cada una de ellas es igual al 
producto de los determinantes de las células diagonales. Pero las 
matrices At, ..., AY y las matrices Af**, ..., Af se descomponen 
de modos distintos. Para las primeras tenemos 


144]=1B4|-1C |, ¿=1, ...,r, (4) 


mientras que las matrices A¡**, ..., A? pueden ser divididas me- 
diante una linea vertical y otra horizontal de manera que el cua- 
drado superior de la izquierda sea de orden r. Puesto que la +l- 
tima fila de este cuadrado está compuesta de ceros, su delerminan- 
te es igual a cero. El determinante de la matriz Af'* es igual al 
producto del determinante del cuadrado indicado por el determi.- 
nante del cuadrado complementario. Luego, | 47*|=0 y, por con- 
siguiente, 


¡Al=0,, 1831-10 I1=... +(—1)7*a0,, 1 811: |[C]= 
=(8, 1 BI)... +1), 181)-1C]=)8|-1C) (15) 


que es lo que queriamos demostrar. El caso en que la matriz A es 
de la forma 


a=110,I=[5 E). 


es aun más sencillo, ya que ahora se tiene a, ,,,=... =0,=0 
y por esto de (13) y (14) obtenemos inmediatamente (15). 

TEOREMA 3 Si en las matrices cuadradas A=|a,,l| y B=|1B;,l| 
de un mismo orden n coinciden todos los elementos correspondientes 
menos los elementos de una fila i-ésima «cualquiera, se tiene 


Gr An Ar1 » Oya A Cn 
Ga AmlelBn -- Bnl= 24 + Bn --- %n+Bin|. (16) 
[e Dúo Oo y . MM. . Ann Far p>00 Cn 


Este teorema suele llamarse a veces teorema de adición de de- 
terminantes. Pasando a su demostración, designemos mediante C la 
matriz del segundo miembro de Ja igualdad (16). Para matrices de 
primer orden la igualdad (16) es evidente. Aplicando la inducción, 
supongamos que para matrices de orden n—l el teorema 3 es 
cierto. Si en la fórmula (16) ¿«=1, desarrollando el determinante 
de la matriz C según la fórmula (9), obtenemos 


ICl= (2, BICI... + (13% (0 HB) 1051. 
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A 
Es evidente que Cj= A¡= B/ y, por consiguiente, se tiene 


[C]=(%,] Ar—... +(—1)7 0,14 + 
+(B1,1Bil—... +(—1)7'B,,181) =] 41|+18B1. 


Supongamos ahora que en la fórmula (16) ¡> 1. Entonces, se 


tiene 
[C[=a,1C |... +(—1)"7*0,,]C1]. (17) 


Las matrices C!, ..., Ci son de orden n—1l y por esto para 
ellas es válido el desarrollo de tipo (16). Como resultado, obtenemos 


IC]=14414+-1B81] (=1, .... 2) 


y, en virtud de la relación (17), tenemos |C|=|A]+| BJ]. 

Desde el punto de vista formal, la definición principal de deter- 
minante sirve también para matrices formadas por elementos de un 
anillo asociativo K cualquiera (no necesariamente conmutativo). 
En la demostración de los teoremas 1, 2 y 3 tampoco se ha empleado 
Ja conmutatividad de K. Sin embargo, una serie de propiedades de 
los determinantes, de importancia para las aplicaciones, dependen 
de la conmutatividad del anillo principal K. Una de estas propie- 
dades se indica en el siguiente teorema. 

TEOREMA 4. Sea A una matriz cuadrada formada por elementos 
de un anillo conmutativo K. Sí se multiplican todos los elementos 
de una fila de la matriz A por un elemento AE K, el determinante 
de la matriz también se multiplicará por A. En ótras palabras, se 
tiene 


Ar --- Op Ar... Ay 
Ma, HO, = A Zi Ain 
ar Aun Eat >. 


La demostración se realiza igual que en el teorema anterior y 
no la vamos a repetir. Señalemos solamente el siguiente corolario 
importante: 

COROLARIO. Para cualquier matriz cuadrada A de urden n formada 
por elementos de un anillo conmutativo K y para cualquier AEK 


se tiene 
p2L4A]=4"| A]. 


En efecto, al multiplicar ta matriz Á por 4, cada una de sus n 
filas se multiplicará por A. Por consiguiente, el determinante de la 
matriz A se multiplicará por A”. 

2.2. Propiedades principales de los determinantes. Consideremos 
una matriz cuadrada arbitraria A*w=||x,,|[| de orden n formada por 
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elementos de un anillo cualquiera K. Según la definición principal, 
se tiene 


¡A|=4, 14] ]—0a,.  Ajl+... +(—3)* a. 1 AT 1, (1) 


donde Af es la matriz que se obtiene de A suprimiendo la primera 
fila y la j-ésima columna. Aplicando ahora al determinante de la 
matriz Af la misma fórmula, obtenemos 


| Aj] = a, | Añl—... +(—1Y a). fo 141 1+ 
H(— 190, jr AP IA (1 1 Al, (2) 
donde A es la matriz que se obtiene de A suprimiendo la primera 
y la segunda filas y la j-ésima y la k-ésima columnas (j yk). 


Introduzcamos en la fórmula (1) en lugar de los valores | A! | 
sus valores (2). Como resultado, llegamos a la relación 


3 ¡k 
¡Af= Az a, ez 1 All. (3) 


Aquí Ja suma se extiende a todos los pares posibles f, k de dife- 
rentes números, pertenecientes al conjunto 1, ..., n y el signo ¡más 
o menos se toma de acuerdo con las fórmulas (1) y (2). Las matri- 
ces AM y Af coinciden evidentemente y, por lo tanto, Ja fórmula 
(3) puede ser representada en la forma siguiente: 


|Al= 2, (+ 2,/%) +59%,%)/14%1. (4) 


Calculemos ahora con mayor exactitud cuáles son los signos que 
deben tomarse en la última fórmula. En virtud de (2), para el 
j-ésimo término de (1) tenemos 


(—1y**0,,| Al|= e... +(—1)*ta,,(—1* a) A+ ... 


Análogamente y teniendo en cuenta que ¿< k, obtenemos para 
el k-ésimo término de (1) 


(IA al Atl (IA a (1 ay ALE 


Por consiguiente, el coeficiente del término | 4/4] de la fórmula 
(4) es igual a 


(—1y+4+1 (2%,/%% — A 14% y) =e (1) +4+1+2 dó 
Leza 


y, en consecuencia, 
Al= E] a! AR 5 
A] PM ) a (5) 


La fórmula (5) se denomina desarrollo del determinante según 
los elementos de la primera y segunda filas. Es fácil memorizarla: 
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se toman todos los determinantes posibles de orden dos formados por 
los elementos que se hallan en la primera y segunda filas y en las 
columnas j-ésima y R-ésima (ji <Rk) y se multiplican por los deterini- 
nantes de las matrices correspondientes que se obtienen al suprimir 
en ta matriz A las filas y columnas indicadas. Los productos se 
multiplican además por (—1y+***1*?, donde el exponente es igual a 
la suma de los números que curresponden a tas filas y a las colum- 
nas suprimidas, y después se suman. La suma algebraica así obtenida 
es igual al determinante de la matriz dada. 

Reglas semejantes tienen lugar también para los desarrollos según 
- las tres primeras, las cuatro primeras, etc. filas. Pero en lo sucesivo 
no las necesitaremos. 

Emplearemos ahora la fórmula (5) para deducir una serie de 
propiedades principales de los determinantes. En lo que sigue se 
supone que los elementos de las matrices consideradas se toman de 
un anillo conmutativo XK. 

TEOREMA 1. Si en una matriz cuadrada se cambian entre sí dos 
filas cualesquiera, el determinante de la matriz nueva será ¡igual al 
determinante de la matriz inicial tomado con el signo menos. 

Para matrices de segundo orden esta proposición se comprueba 
directamente: 


[9 É]=a5—pw [2 g|=8-8=-(05— By. 


A continuación, suponemos por inducción que el teorema es justo 
para las matrices de orden n—1 y que la matriz dada A=||«,,|) 
es de orden nr. Supongamos que en Á se cambian entre si las dos 
primeras filas. De la fórmula (5) vemos que todos los determinantes 
de orden dos cambian de signo, mientras que los factores adiciona- 
les no varían. Luego, toda la suma adquiere el factor —1 que es 
lo que queríamos demostrar. 

Consideremos el caso en el que se cambian entre sí la j-ésima 
y la k-ésima filas, donde | <¡<Hk. Entonces, la primera fila per- 
manece invariable y del desasrollo (1) deducimos que cada factor 
| 44] obtendrá después del intercambio el valor opuesto; por ello, 
toda la suma obtendrá después del intercambio de las filas el valor 
opuesto. 

Finalmente, supongamos que se cambian entre si la primera y 
la ¿¡-ésima fila, donde ¿> 2. Este mismo resultado obtendremos si 
cambiamos entre sí primero la primera y la segunda filas, luego 
la segunda y la i-ésima y, finalmente, la segunda y la primera. 
Según hemos demostrado el determinante cambiará cada vez de 
signo y después de los tres cambios el determinante se multiplicará 

— |] 


COROLARIO 1. El determinante de una matriz cuadrada en la que 
coinciden dos filas es igual a cero, 
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Cambiando las filas entre sí se puede conseguir que las fillas 
coincidentes sean la primera y la segunda. El determinante de ta 
matriz con las filas cambiadas o bien coincidirá con el determi- 
nante de la matriz inicial o bien diferirá de él en el factor — 1. 
De la fórmula (5) se ve directamente que el determinante de una 
matriz en la que coinciden las dos primeras filas es igual a cero. 
Por esto será también igual a cero el determinante de la matriz 
inicial. 

COROLARIO 2. Si a los elementos de la r-ésima fila cualquiera de 
la matriz cuadrada A=||a,,|| se agregan los elementos correspondien- 
tes de otra fila s-ésima cualquiera (sr) multiplicados por un fac- 
tor arbitrario A, el determinante de la matriz nueva será igual al 
determinante de la inicial. 

En electo, según los teoremas 3 y 4 del punto anterior, se tiene 


X,) ... e. Ann % co... Asa Ci ve. » An 
Ber ee Cen Es no. Un Ey A Fer 

. e . . Re. .o.*. .o..o..— e . >| .*. .<<.. 080w.-msmse d A 
Gs FAL... As HAL), A a 
nr PRA Can An o. Can Ar ps Ao 


Aquí el último determinante tiene dos filas coincidentes y, por 
consiguiente, es igual a cero. 

Hasta el momento todos nuestros resultados estahan relacionados 
con las filas de los determinantes. Hagamos el primer paso para 
introducir en el juego las columnas. 

TEOREMA 2. Para toda matriz cuadrada A=||a,,|| de orden n es 
wilido el siguiente desarrollo según los elementos de la primera 
columna: 


¡A|=au,, [Aa lMii+...+(1)7?* 0.1451, (6) 


dunde A! es la matriz que se obtiene de A suprimiendo la primera 
columna y la r-ésima fila. 

Consideremos que los elementos «,, de la matriz dada son letras. 
Entonces, el determinante de la matriz Á será un polinomio en 
estas letras cuya forma general se ha establecido en el teorema 1 del 
punto anterior. En particular, hemos señalado allí que cada término 
del polinomio | A| contiene un factor, y sólo uno, perteneciente al 
conjunto %,,, %, ..-, Gn. Agrupemos en | A| todos los términos 
que contienen el factor «,,, saquemos fuera de los paréntesis este 
factor común y designernos mediante A,, la expresión comprendida 
entre los paréntesis. De esta forma obtendremos 


lA ]= 92, A +2 An +++ 0 As: (7) 
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Comparando las fórmulas (7) y (1), llegamos a la conclusión de 
que 
A, =]4] . 


Para hallar la expresión análoga para A,,, es suficiente recurrir 
ahora al teorema 1. En efecto, cambiemos sucesivamente la r-ésima 
fila de la matriz A con cada una de las anteriores, elevándola más 
y más. Después de r—] intercambios de esta indole obtendremos 
una matriz B que difiere de la matriz A sólo en el orden de filas 
y, por consiguiente, tendremos 


¡[41=(—1)”*/B1. 


Desarrollando el determinante AB según los elementos de la pri- 
mera fila, obtenemos 


[8]=0,.181|—0,, | Bi +... +(—1)"7*a,,1811, 
y por lo tanto 
¡Al=e (ED Bi... + (195%, 1811. 
Comparando este desarrollo con el de la fórmula (7), llegamos 
a la relación 
A, =(—1)7*]8B5]. 


La matriz Bl se obtiene suprimiendo en la matriz B la primera 
fila y la primera columna. Está claro que la misma matriz se ob- 
tendrá al suprimir en Á la r-ésima fila y la primera columna, es 
decir, que B;= As. OS en la fórmula (7) el valor A,, 
por el valor (—1)'”*| At], obtenemos el desarrollo deseado (6). 

Anteriormente hemos indicado que la matriz, en la que la pri- 
mera, la segunda, etc. filas coinciden respectivamente con la pri- 
mera, la segunda, etc. columnas de la matriz A, se llama (rans- 
puesta respecto de Á y se designa por A”. Es evidente, que siendo A 
una matriz cuadrada de orden r, la matriz A* es también una 
matriz cuadrada de orden n. 

TEOREMA 3. El determinante de una malriz cuadrada no varía en 
la transposición, es decir, 


¡A [=]Al (8) 


Para matrices de orden uno la proposición es evidente. Recu- 
rriendo, al igual que antes, a la inducción, aceptermos que la ma- 
triz dada A=||a,,|] es de orden n >1 y que el teorema es cierto 
para las matrices de orden 2n—1. Desarrollando el determinante de 
la matriz A según los elementos de la primera fila y el determinante 
de la matriz transpuesta A” según los elementos de la primera 
columna, obtenemos 


¡Aj=a,] 4 |—a, Alt... +(—1)" 0,143), (9) 
¡A ma, HAY a MAY E + (1) a, 1(43 1. 


44 Cap. !. Matrices y determinantes 


Sin embargo, es fácil ver que (4) =(A%Y. Las matrices A! son 
de orden n—1 y, por la hipótesis de inducción, se tiene 


HAY ]= HAD ]=[4 1. (t=1, ..., 1). 


Comparando estas relaciones con los desarrollos (9) obtenemos (8). 

Por consiguiente, al calcular el determinante de una matriz las 
columnas y las filas pueden ser sustituidas unas por otras. Esto 
significa que de todo teorema referente a las propiedades del deter- 
minante de una matriz, enunciado en términos de filas o de colum- 
nas, se puede obtener un nuevo teorema sustituyendo las filas y las 
columnas unas por otras. En particular, de las propiedades de los 
determinantes indicadas anteriormente y relacionadas con las filas, 
obtenemos el resultado siguiente. 

COROLARIO. Al cambiar entre si dos columnas de una matriz su 
determinante adquiere el valor opuesto. El determinante de una ma- 
triz cuadrada que tiene dos columnas idénticas es igual a cero. Si se 
multiplican todos los elementos de una columna de la matriz por A, 
el determinante de la matriz también quedará multiplicado por 4. 
Sí se agregan a todos los elementos de una columna de la matriz los 
elementos correspondientes de otra columna, multiplicados por un 
número fijo, el determinante de la matriz nueva será igual al deter- 
minante de la inicial. 

Análogamente, sustituyendo las filas por las columnas obtenemos 
del desarrollo (5) el desarrollo según las dos primeras columnas: 


Aj a 
Al= (—1)4/+1+8 d1 rl. API. 
[A] 2 ae, |AH| 


Finalmente, del teorema de adición de determinantes, enunciado 
en términos de filas, obtenemos la fórmula correspondiente 


Ay e...» Ar e... An a ce... B,, ..». in 
. . . ..o. . + . . . . . » = 
Ea -»» An : Ran Ct . Bas Lan 
sr Ar; + Br - Lin 
Sl , o.  .. 1... .... 


An e... An + Par eco. Can 


referente a las columnas. 

Hasta el momento nos hemos valido de los desarrollos de un 
determinante según los elementos de su primera fila o su primera 
columna. Al mismo tiempo, conocemos la ley de variación del de- 
terminante al cambiar en él entre sí filas o columnas. Esto ofrece 
la posibilidad de obtener inmediatamente de los desarrollos según 
Jos elementos de la primera fila o la primera columna los desa- 
rrollos análogos según los elementos de cualquier fila o columna. 
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TEOREMA 4. Para una matriz cuadrada arbitraria A=||a;,]| de 
orden n son válidos los siguientes desarrollos según los elementos de 
la r-ésima fila y s-ésima columna: 


|4]=(—IN Man lA (1) 9001 47) (10) 
[Aj (1399 a AFI a 1 AL (11) 


donde Aj es la matriz que se obtiene de A suprimiendo la i-ésima 
fila y la j-ésima columna. 

Puesto que las filas y las columnas se encuentran en las 
mismas condiciones basta demostrar sólo una de las fórmulas (10) 
y (11), por ejemplo, ta fórmula (10). Cambiando sucesivamente la 
r-ésima fila de la matriz A con cada una de las anteriores, después 
de r—1 intercambios obtendremos la matriz 


Ar) Er Urn 

%u A . 27 
B=|%o1 lr, 32 Ar=1>1n 
Aer, 1 A 2 Ars n 


rt Ang dC2bDr* Ann 


Según el teorema sobre el intercambio de filas tenemos | 4|= 
«=(—1)'71|B]. Desarrollando aquí el determinante B según los 
elementos de la primera fila y empleando las relaciones evidentes 
Bi = Af, llegamos al desarrollo (10). 

El determinante de la matriz A! se llama menor del determi.- 
nante de la matriz Á correspondiente al elemento a,,. La expresión 
(— 1)+1] 4] | se llama adjunto del elemento a,,en | A] y se designa 
con frecuencia mediante [ A|,,, Empleando el concepto de adjunto, 
las fórmulas (10) y (11) pueden ser representadas en forma más 
breve: 

enl Ala + an lAln]+... +1 Aln=141. (12) 
AA+ aytAl+... +a.y14 li =/14l. (13) 


En estas igualdades cada elemento a,, se multiplica por su 
adjunto | A]; ¿Qué sucederá si se toma la suma de los productos 
de los elementos de la ¿-ésima fila por los adjuntos de los elementos 
correspondientes de otra fila cualquiera? Con el fin de obtener la 
respuesta, sustituyamos la ¿-ésima fila de la matriz dada A por 
su i-ésima fila sin alterar todas las filas restantes, incluyendo tam- 
bién la ¿-ésima. Obtendremos una matriz B en la que son idénti- 
cas las filas ¿-ésima y j-ésima. El determinante de esta matriz es 
“igual a cero. Ál mismo tiempo, es evidente que los menores de 
los elementos de la /-ésima fila en los determinantes de las matrices 
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A y B coinciden. Desarrollando B según Jos elementos de la ¡-ésima 
fila, obtenemos 


ailAlp+...+2n]4ln=0 (7%). (14) 


Sustituyendo en los razonamientos las filas por las columnas 
obtenemos la segunda serie de relaciones: 


01 141,+...+%,./141,,=0 (3). (15) 


Las relaciones (12), (13), (14) y (15) suelen enunciarse de da 
forma siguiente. 

TEOREMA 5. La suma de los productos de los elementos de una 
fila (de una columna) de un determinante por sus adfuntos es igual 
al valor del determinante. La suma de los productos de los elementos 
de una fila (de una columna) de un determinante por los adjuntos 
de los elementos correspondientes de otra fila (columna) cualquiera 
es igual a cero. 

Hagamos ahora algunas observaciones acerca de los métodos de 
cálculo de determinantes. Los determinantes de orden dos y tres 
se calculan generalmente mediante las fórmulas iniciales. Por ejemplo, 


17-25 
2 41 
3 —I8 


Aquí hemos desarrollado el determinante de orden tres según 
los elementos de su primera fila. Si uno de los elementos del de- 
terminante dado fuese igual a cero, resultaría más conveniente 
recurrir al desarrollo según aquella fila (o columna) que contenga 
este elemento nulo. Este mismo método se puede aplicar al calcular 
determinantes de orden elevado que contienen muchos elementos 
iguales a cero. En particular, lenemos 


41 2 1 2 4 
=1|_| s1+2|38/+5 . 4 |-187. 


A A + 


Ue AA Cen =0 ai NN a = 0... a 
A IS: o E É E MALAS E? na 
0.0... %, Lan 
y análogamente 
DO Ao 


0 Cros, 2. . ... An=t. 


Or a ogOOOS Arm 


=(— (ya, * 
Crd, e” -* Y. 


n(1=!1) 
=> (—]) A 
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La situación es más compleja si ei orden del determinante dado 
es relativamente elevado (por ejemplo, 7 y más) y entre los elemen- 
tos del determinante hay pocos ceros o no los hay. En este caso, 
al determinante se aplican primero las transformaciones indicadas 
en el corolario 2 del teorema 1, tratando de escoger el coeficiente A 
de modo que el determinante nuevo contenga en algunos lugares 
ceros O tenga en cierto sentido una estructura más sencilla. Estos 
métodos se ven con claridad en el ejemplo siguiente. Supongamos 
que debemos calcular el determinante 


Restando en este determinante la quinta fila de la sexta, res- 
tando en el determinante obtenido la cuarta fila de la quinta, 
restando después la tercera fila de la cuarta, etc., obtenemos 
l2.3 4 5 0.6 
l 1 1 1 ] —5 
l 1 1 lI—3 | 
l ] l1—5 1] 

] 1 
[E—=5 1 | l 


Restando ahora la sexta fila de la primera, de la segunda, ... 
..., de la quinta, obtenemos 


00.7. 2. 3.4 5 
0.6 0 0 0-6 ER 

d=lo 6 0-6 0 oO D0T 0 9 Gl: 
0. 6-6 0 0 0 A O 
1-5 1 1 11 


En el determinante obtenido de orden cinco agregamos a la 
primera columna las restantes y después desarrollamos el determi- 
nante según los elementos de la primera columna. Tendremos 


21 2 3 4 5 
0.0 0 0—I 
d==6'.| 0 0 0]  0|[=-—6*-2] 
O 0-—!t 0 0 
0-1! 0 O 0 
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Mediante cálculos análogos se obtiene también la fórmula general 


123...n=x1 n 
234... n 1 
n12... n—-2 n—] 
Este determinante lleva el mombre de circutador de orden n, 
debido a que sus filas se ohtienen por permutaciones cíclicas de 
los elementos de la primera fila. Es esta regularidad en la dispo- 
sición de los elementos del determinante en la que se basa la 
deducción de la fórmula (16) que, a propósito, no será empleada 
en lo sucesivo. Actualmente para hallar el valor numérico de los 
determinantes de orden elevado se recurre a los servicios de los 
centros de cómputo en los que existen programas standard para 
el cálculo de determinantes adaptados a aquellos tipos de máquinas 
con las que está equipado el centro. Hallemos la estimación apro- 
ximada del número de operaciones aritméticas suficiente indudable- 
mente para el cálculo del determinante de una matriz arbitraria 
lla,,]] de orden a. 
Supongamos que eos Calculamos az y representamos el 


nin—t) 
NET ( —] nn 
= (— 1) ? A A EE (16) 


determinante dado en la forma 
la -.- 2% 
sy As có... An 
E . . . e e . . 
Va, Cra e... e 


Durante esta operación realizamos una inversión y n—1 multipli- 
caciones. Á continuación, agregamos a los elementos de la se- 
gunda, de la tercera, ..., de la n-ésima filas los elementos de la 
primera fila multiplicados. respectivamente por —y, —Gyp +... 
—G,, (un tota] de (n—1)? multíplicaciones e igual número de 
adiciones). Después de esto el problema se reduce al cálculo de un 
determinante de orden n—-): 


Lt so. El, nt 
Ap 
Aa-1,1 -+- Ant, n-1 
Continuando este proceso, tendremos que calcular al final del 
mismo solamente el producto %,%, ... at” (es decir, n—1 


multiplicaciones). Al aplicar el algoritmo expuesto necesitaremos 
realizar un total de n-—1 inversiones de números, de 
a (a— 1) + (1) (12) 4 ...42:1= 0 DAL 


multiplicaciones, de Coman adiciones y de n—1l multipli- 


caciones finales. Por lo lanto, para calcular un determinante de 
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: | 
orden »: es necesario efectuar aproximadamente cerca de 3” mul- 


tiplicaciones y de un número igual de adiciones. No nos deten- 
dremos aqui en el estudio más detallado de esta cuestión. Varias 
definiciones y resultados exactos se indican en el artículo de B. A. [Tan, 
¿O cnoco6ax BHuHCAeHHa 3HaYenHhÁ MHOrouneHnoB”, Ycnexa marTema- 
TmuecKHx Hayk 2!l, Ne ] (1966), 103—134 (V. Ya. Pan, Acerca 
de los métodos de cálculo de valores de polinomios), así como en 
la bibliografia señalada en este articulo. 


2.3. Determinante de un producto. Matrices inversas. Un papel 


importante lo desempeña en la teoría de matrices el siguiente teo- 
rema. 

TEOREMA 1 (sobre la multiplicación de determinantes). El deter- 
minante del producto de matrices cuadradas (formadas por elementos 
pertenecientes a un anillo conmutativo K) es igual al producto de 
los determinantes de las matrices. 

Sean dadas dos matrices cuadradas A=||a,,l| y B=||B,,[| de 
orden n. En virtud del teorernma sobre las matrices semidescom- 
puestas (p. 2.1), se tiene 


o A o A 
A A A 


Am Lay --: En 0 0 ... 0 
—=100...0 Br --- Bin 
0 —1...0 Bn Ba Ea Pe, 
000... —IBa Bu «> - Ban 

En el segundo miembro aparece el determinante de una matriz 
de tipo especial de orden 2n. Sin alterar el valor del determinante, 
con esta matriz se pueden realizar sucesivamente las siguientes 
transformaciones: agregar a su primera fila los elementos de la 
(1 + 1)-ésima fila multiplicados por «,,, los elementos de la (n + 2)- 
ésima fila ranultiplicados por %,y, etc., los elementos de la 21-ésima 
fila multiplicados por «,,,. Así surgirá una matriz de orden 2n, en 
la que las primeras n posiciones de la primera fila estarán ocupa- 
das por ceros, mientras que las otras n posiciones estarán ocupa- 
das por los productos de la primera fila de la matriz A por las 
columnas de la matriz B. En la nueva matriz de orden 2n agre- 
gamos ahora a los elementos de su segunda fila los elementos de 
la (1+1)-ésima fila, de la (n+2)-ésima fila, etc., multiplicados 
respectivamente pOr %p, Om +...» An. Después realizamos trans- 
formaciones análogas con la tercera, ..., con la ri-ésima filas. 


4—18343 


[41-1B1= 
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Después de esto obtenemos la igualdad siguiente: 


0...0 Y abi ... AA Bin 


O... . ATA ... Y ni Bin Ñ 


11 .«.... 17 


0... —1 Pm .-- Ban 


Para reducir el determinante de la derecha a Ja forma semnides- 
compuesta, cambiamos en él la primera columna con la (n-+1)- 
ésima, la segunda con la (n1-+2)ésima, ..., la n-ésima con la 
2n-ésima. Así obtendremos la igualdad 


AA Ba ... Y Bin A 


Ad Ea 
[41-181=(—1y as ¡iio ve cor dis 


11 e... 175 


Puesto que el determinante de una matriz semidescompuesta es 
igual al producto de tos determinantes de las células diagonales, 
de la relación (1) se deduce que 


¡AjlB]=a(— en LA 
2.8; eje Y LB in 


[41-18/=/4B1, (2) 


que es lo que queriamos demostrar. 

Hemos demostrado el teorema l para el producto de dos matri- 
ces. Está claro que de aquí se desprende su validez también en el 
caso del producto de un número finito cualquiera de matrices. Por 
ejemplo, 


es decir, 


|ABC|=|(AB)C|=|AB]-1C|=[4|-1B]-1C]. 
En particular, para cualquier matriz cuadrada A se tiene 
¡Ar [=|A]* (£=0, 1,2, ...). (3) 


Sabemos que la transposición de una matriz cuadrada no altera 
su determinante. Por ello, para dos matrices cuadradas cualesquiera 
de un mismo orden, se tiene 


|4/-18/=/48|=/4'B]=14B'|=|A'B"]. 
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Sea, por ejemplo, 


0 
la vol 
En este caso, se tiene | 
0 +y xu+ yu 
- ES a e= ( y? 21 y? QQ 3 
ad a PEN O | (4 y") (ue 4 09) — (xu + yuy, 
es decir, 


(x0— yuy = (1 4 y?) (u? 4- 0) — (xu + yo)”. 
Esta relación suele escribirse en forma de la siguiente identidad 
(4 y) (ue + 0%) = (xu— yu)? 4 (xu + yo)" 


que se denomina identidad de Lagrange. 

Empleemos ahora el teorema l para un estudio más detallado 
de las propiedades de la matriz inversa. 

Consideremos una matriz cuadrada cualquiera A=||a,,|]] de or- 
den n. Formemos una matriz con los adjuntos de los elementos del 
determinante A y tomemos su transpuesta. La matriz así obtenida 
se llama «adjunta de A y se designa mediante A*. En otras pala- 
bras, 


Ala, IA la ... AL, 
go [14 ho 14h ->- 14 La 
VA lin 1 Alan , A fan) 


Calculando los productos A-A* y A*.A según la regla de mul- 
tiplicación de matrices y teniendo en cuenta las fórmulas de (12) 
a (15) del punto anterior, obtenemos directamente las relaciones 


importantes 
A-A*=A*"-A=m|A| E, (4) 


donde E es la matriz unidad. 

El determinante de la matriz A es un elemento del anillo prin- 
cipal K, del cual se toman los elementos de todas las matrices 
consideradas. Supongamos que para el elemento | A] existe en K su 
inverso | 4|7*. Entonces, multiplicando las relaciones (4) por | A]|-*, 
llegamos a las igualdades 


A: |A|r:4*=|4/|7:4.A=E, 
de donde se deduce que 
ATi=| A]. A". (5) 
Por otra parte, si la ecuación matricial 
AX = E 
ye 
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tiene solución, obtenemos pasando a los determinantes 
¡A]-1X]|=1, 


es decir, el elemento | 4| es invertible en el anillo K. 

Uniendo los resultados oblenidos, llegamos a la proposición 
siguiente. 

TEOREMA 2 Una matriz cuadrada A, formada por elementos de 
un anillo conmutativo K con el elemento unidad, pusee la matriz 
inversa, también formada por elementos de K, st, y sólo si, el deter- 
minante de Á es invertible en el anillo K. Si la matriz inversa 
existe, su determinante es igual al inverso del valor del determinante 
de la malriz dada. 

Por ejemplo, en el anillo de todos los números enteros 
K=(f0, 1, ...) poseen inverso solamente los elementos 1 y —1. 
Por lo tanto, una matriz cuadrada formada por números enteros 
posee la matriz inversa, también formada por números enteros, st, 
y sólo si, el determinante de la matriz dada es igual a zx+l. 

Supongamos que se consideran matrices formadas por elementos 
de un cuerpo conmutativo. En un cuerpo conmutativo, todo ele- 
mento no nulo posee su inverso. Por ello, sobre un cuerpo conmu- 
tativo son [nvertibles aquellas matrices, y sólo aquéllas, cuyos 
determinantes son diferentes de cero. 

Una matriz cuadrada cuyo determinante es igual a cero se 
llama singular. En el caso contrario, la matriz se llama regular. 
Por esto, la condición indicada anteriormente para que una matriz 
sea invertible puede ser enunciada de la forma siguiente: una ma- 
triz cuadrada sobre un cuerpo conmutativo posee inversa si, y sólo 
st, es regular. 

Hemos visto que para matrices A regulares sobre el cuerpo 
conmutalivo K, se tiene 

471] =|Ajr!. 
De aquí obtenemos 
ATA == AS... AT =]A]r? (m=1,2,...), 


de modo que la fórmula (3) es válida no sólo para los valores 
naturales de k, sino también para cualesquiera valores enteros de k 
(siempre que la matriz Á sea invertible). 

Según el p.1.3, una matriz cuadrada A se llama ortogonal, si 


AA'=A'A=E. 


Pasando a los determinantes, obtenemos |A|t=1 y, por ello, 
si las matrices se consideran sobre un cuerpo conmutativo K, se 
tiene |4]==>w!. Gracias a esto todas las matrices ortogonales se 
descomponen en dos conjuntos de matrices: las matrices ortogonales 
propias de determinante +1 y las matrices ortogonales impropias 
de determinante —1. Todas las matrices ortogonales propias for- 
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man, respecto a la operación de multiplicación, un grupo que 
constituye un subgrupo del grupo de todas las matrices ortogonales. 

Recordemos que una matriz cuadrada A definida sobre el cuerpo 
de Jos números complejos se llama unitaria si AA'=E. Tomando 


los determinantes, obtenemos | A|-| A]= 1, es decir, el módulo del 
determinante de una matriz unitaria es igual a la unidad. 

Para concluir hallemos et determinante de la matriz adjunta. 
Aceptemos das el anillo XK es el anillo de tos polinomios en Je- 


tras x,, sa [| = , n) con coeficientes enteros y consideremos la 
matriz ll Según la fórmula (4) se tiene 
Xx-XA*=|X]|-E 


y por lo tanto 
[X1-1X*]=|X Y”. 
Puesto que el polinomio | X| es diferente de cero, la Igualdad 
puede ser dividida por |X| y así obtenemos la fórmula deseada 
[X=] X[P=3, (6) 
ambos miembros de la cual son polinomios en las variables x,, con 
coeficientes enteros. Pero, si coinciden dos pollnomios de este tino, 
también coinciden sus valores para cualesquiera valores de las 
variables pertenecientes a un anillo conmutativo arbitrario. Por 


esto, la fórmula (6) es válida para matrices cuadradas arbitrarias 
sobre cualquier anillo conmutativo. 


2.4. Sistemas cramerianos de ecuaciones lineales. Consideremos 
cl conjunto de condiciones 


de 15 + . . + Amón — Pr. | 
A E A = =P, 


(1) 


donde E,, ..., E, son End, mientras que a;, y f, son elementos 
de un anillo K. El conjunto de estas condiciones se llama sisterna 
de ecuaciones lineales con las incógnitas ÉE,, ..., E, sobre el anillo K, 
Una sucesión E?, ..., 3% de elementos del anillo K se llama solu- 
ción del sistema (1) si al tomar en las condiciones (1) en lugar de 
las variables E,, ..., E, los elementos correspondientes E2, ..., Es 
todas las condiciones. resultan veridicas. Introduciendo las matrices 
EA E | P, 
A= . . . . . $ x= ; y b= A 
LA -:* Cr A Boj 


el sistema (1) puede ser representado en la siguiente forma ma- 
tricial 
Ax =b. (2) 


54 Cap. Í. Matrices y delerminantes 


La matriz A se llama matriz del sistema (1) y la matriz 


CA, ASE Ein B, A] 


de: e: 
Xt .. A Bn] 


se llama matriz empliada del sistema 41). Las propiedades de la 
matriz B nos harán falta en el p. 5.3 al estudiar de forri." más 
detallada las propiedades del sistema (1); por ahora nos limitare- 
mos a considerar el caso en que rm =»1, es decir, en que la matriz A 
es cuadrada. Supongamos que la matriz Á es invertible. En este 
caso, multiplicando ambos miembros de la igualdad (2) a la izquier- 
da por A”*, obtenemos 


x= Á7!L, (3) 


Viceversa, multiplicando la relación (3) a la izquierda por A, 
obtenemos (2). Por consiguiente, las condiciones (2) y (3) son equi- 
valentes y por ello la fórmula (3) puede ser considerada como la 
fórmula que ofrece la solución del sistema de ecuaciones (1) siempre 
que la matriz del sistema sea invertible. 

Hasta el momento no hemos supuesto siquiera que el anillo K 
sea conmutativo. Supongamos ahora que K es un cuerpo conmuta- 
tivo. En este caso, el hecho de que Ja matriz Á sea invertible 
equivale a que sea regular, la matriz inversa se expresará en tér- 
minos de la matriz adjunta en la forma anteriormente señalada 
y la fórmula (3) podrá ser representada de la forma siguiente 


x=]| A]! A. 


Tomando en lugar de la matriz 4* su expresión en términos de jos 
adjuntos del determinante |A| y realizando la multiplicación en 
el segundo miembro, obtenemos 


iS IA LB + .-.+/14 niBn 
S > YA] dni 


o bien, en forma definitiva, 


Qu As GQ. i-1 p, Aris... Cin : 
A A TE 1. (4) 
' | | . je e . ' : . > . . . . . “ a E NES cl 

Lar o Cn, 1 B, A. ON An 


Para comprobar bastará desarrollar el determinante que figura 
en el numerador <egún las elementos de la ¡-ésima columna. 

Un sistema de ecuacioms Iimeales sobre un cuerpo conmutativo 
se Jlama crameriano si el número de ecuaciones coincide con el 
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número de incógnitas y si el determinante de la matriz del sistema 
es diferente de cero. Vemos, por consiguiente, que fodo sistema 
«rameriano de ecuaciones lineales tiene una solución, y sólo una, 
E. .... E,) y que esta solución viene dada por las fórmulas (4). 
Las fórmulas (4) se llaman fórmulas de Cramer, en memoria de 
Cramer, matemático de mediados del siglo pasado, ya que aparecie- 
ron, por lo visto, por primera vez en uno de sus trabajos. Para 
n—2 y n=3 las fórmulas de Cramer han sido dadas de forma 
detallada en el p. 2.1. 

Las fórmulas de Cramer dan una expresión «cerrada» de la solu- 
ción de un sistema crameriano de ecuaciones en términos de los 
coeficientes de estas ecuaciones. Sin embargo, no es conveniente 
hallar la solución de un sistema lineal empleando las fórmulas de 
Cramer. En efecto, recurriendo a las fórmulas de Cramer, habrá que 
calcular los valores de n+1 determinantes de orden n. Según las 
estimaciones aproximadas, realizadas en el p. 2.2, habrá que efec- 
tuar para ello cerca de n* multiplicaciones y adiciones. Al mismo 
tiempo, el método corriente de eliminación Sucesiva de incógnitas 
requiere, como ahora veremos, un número de operaciones conside- 
rablemente menor. Este método, ordenado de modo adecuado, se 
lama en la actualidad algoritmo de Gauss. 

Consideremos, pues, de nuevo el sistema de ecuaciones linea- 
les (1) cuyos coeficientes han sido tomados de un cuerpo conmuta- 
tivo K. Si todos los coeficientes de una de las ecuaciones son 
iguales a cero podernos suprimirla del sistema. Si los coeficientes 
de las incógnitas son iguales a cero, mientras que P 350, el sistema 
no tiene solución. Por esto se puede aceptar que algunos de los 
coeficientes de las incógnitas en la primera ecuación son diferentes 
de cero. En este caso, cambiando si es necesario la numeración de 
las incógnitas, podemos llevar el sistema a la forma (1) en la que 
a, 50. Calculemos «;? y multipliquemos todos los miembros de 
la primera ecuación por aj. Á continuación, de la segunda, de 
la tercera, ..., de la m-ésima ecuaciones restamos término por 
término la primera ecuación multiplicada por %,,, Ag» +-+. Emp 
respectivamente. Después de esta operación nuestro sistema inicial 
resultará ser equivalente al sisterna de tipo 


E AE Han =P >) 

Abat + + ankin = Br, ' 

Ambas + e... + Amnin = Bm» J 

Al pasar del sistema (1) al sistema (5) hemos realizado una 
inversión, nm multiplicaciones y n(m-—1) adiciones. Procediendo 


de la misma forma con las últimas m-— 1 ecuaciones del sistema (5), 
obtendremos — después de una inversión, de (n— 1) (m— 1) multiplica- 


(5) 
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ctunes y de (1— 1)(m-—2) adiciones —el sistema de tipo 


54 + 1, 2 + As +. E Br, 
Et iS E nba ba 

at, he oo = Br. 

Continuando el proceso ind edo. podremos encontrarnos con 


tres casos: a) en uno de los pasos llegamos a la conclusión de que 
el sistema no liene solución; b) oblendremos un sistema de tipo 


A e A 
SJ , ear da entire aaa — Os 


6 + Ye. nr. Edi O 0 ) 
c) obtendremos un sistema de tipo 


E, de Viasa + Mises +. e- Yinen = = 5, 
Est Vesta ds 0% , 
E O E (6) 
E + Mn nén = a b,.. 1? 


n= " 


En el caso b), expresamos $,, empleando la última ecuación, en 
términos de las incógnitas elibres» E,,,, ..., E. Introduciendo e) 
valor obtenido de E, en la ecuación anterior, hallamos de ella E,..,, 
etc. De esta forma encontraremos unas expresiones lineales de las 
incógnitas E,, ..., E, en términos de las incógnitas «libres». Dando 
valores arbitrarios a las incógnitas «libres», podremos, a partir de 
las fórmulas señaladas, calcular los valores correspondientes de las 
incógnitas E,, ..., E, y obtener de esta forma una solución E,, ... En 
FA sistema dado. Lo mismo ocurrirá en el caso e); 1 
diferencia consistirá solamente en que en este caso A fs 
valores determinados para todas las incógnitas £,, .. 

Calculemos el número de operaciones que hay que ta en 
el caso c) pura obtener la solución. Para reducir e) sistema a la 
lorma 16) taceptando que m = 1) tendremos que realizar « inversiones. 


E DY 
multiplicaciones y 
n(n—1)+(n=1)(1—2+...+2-1 => (a + 1)n (1— 1) 


adiciones. Ádemaás, para hallar del sistema triangular (6) las incóg- 
nilus habrá que realizar adicionalmente 


1424... +01) =>31(n—1) 
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multiplicaciones y un número igual de adiciones. Por consiguiente, 
para resolver el sistema (1) empleando el método de Gauss, es ne- 
cesario realizar, en el caso general, » inversiones, 


l lo, 
q n(n*+3n— 1) Z GN 


multiplicaciones y | 


¿nr +35) 
adiciones. 

Observemos ahora que empleando el método de Gauss puede ser 
culculada también la matriz inversa A”'. Esto se logra de la forma 
siguiente. Se escribe el sistema de ecuaciones lineales Ax=b, en el 
que las columnas x y b se consideran formadas por letras. Después, 
a partir del sistema dado y empleando el mélodo de Gauss, las 
variables ¿,, ..., €, se expresan en dérminos de las variables 
B. ..., P,. Así se obtienen fórmulas de tipo 


E= YB, + ... + YinBn (i= as n). 
Puesto que de Áx=5b se deduce que x= AÁ”!b, la matriz (| y,, ll 


será precisamente la inversa de A. El cálculo del número de ope- 
raciones muestra que en este caso es suficiente realizar n inversio- 
nes, 21 (Ant—1) = 31 multiplicaciones y3 (n*—n) (2n—1)= > n? 
adiciones. 

En los cálculos que hemos realizado acerca del número de ope- 
raciones necesarias para hallar el valor del determinante de una 
matriz, la solución de un sistema de ecuaciones lineales o la ¡inver- 
sión de una matriz, no se han tenido en cuenta algunas operaciones 
secundarias, asi como el aumento del número de cifras decimales 
en los números que se multiplican o se suman. Sin embargo, los 
resultados obtenidos pueden resultar útiles al decidir, si un sistema 
de ccuaciones lineules de interés práctico debe ser resuelto a mano 
o conviene pasar el encargo a un centro de cálculo. 


Complementos y ejerclelos 


1. Empleando las fórmulas de Cramer, resuélvase cl sistema 
xry+zm—2, 
x 4 Oy — 21 mm e 4, 
242 ( mn |, 
2y —2—3l =— 3. 
2. Empleando el método de Gauss hiállense los inversas de las matrices 


a+l a a a 
E 2 El a a+l a a 
2-3 5 y 
3-1 ] a a al a 
a a a a+lj 
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3. Demuéstrese la fórmula (determinante de Vandermonde) 


X1 Lg Xa 
4 4 *a |= 1 (x, —x5) 
e... .. ... .. 40.101.012 <j 
A? e . xn-2 
4. Demuéstrese que 
a+; a EEN a 
a a+x ; a 
. .o. xd A ... . o. . 6. m. Xy Xy sa (1444 +2) 
a a ... G4xXp 


5. Si en el anillo principal K para cualquier a de 22=0 se deduce que 
a=0, el determinante de cualquier matriz antisimétrica sobre K de orden impar 
es igual a cero. 

6. Consideremos una matriz cuadrada arbitraria A (sobre un anillo conmu- 
tativo po de orden n. Suprimiendo en A das filas con los múmeros í,. ..., ir 
(<1<...<!t,«n) y las columnas con los números f,, ..., fp (| <]j, < 
€... < ¡p< n), obtendremos una matriz nueva Al Ao dE de orden n—r. Los 
elementos de ta matriz Á que se hallan en los cruces de las lilas y de las co- 
lumnas suprimidas también forman una matriz cuadrada. El orden de esta última 
matriz es igual a r. Su determinante se denomina menor de orden r del deter- 
minante de la matriz A perteneciente a las filas con los números i,, ..., ti, y 
a las columnas con los números j,, ..., /». Se llama adjunto de este menor el 
determinante de la matrlz Af: > - Je multiplicado por (—1)5+*, donde 5=1, + 
A TO A RS el 1 Tiene lugar la siguiente generalización del desu- 
rrollo de un determinante según los elementos de la primera y de la segunda filas: 
sí en un determinante de orden n se fijan r filas cualesquiera, la suma de los 
productos de los menores de orden r, pertenecientes a las filas escoglilas, por sus 
adjuntos es igual al valor del determinante dado. 

7. Si la matriz cuadrada dada X es simétrica o antisimétrica, la matriz 
ente X”* también es simétrica o antisimétrica. 

8. Sea A una matriz cuadrada de da od y sean x y 5 unas co- 
Jumnas, cuyos elementos son letras: E,, . En y Br A A read 
El sistema de ecuaciones lineales dal tiene So uciones enteras ¿ En +... En paru 
cualesquiera valores enteros de fB,, ..., B, si, y sólo si, [4] = + ). 
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Todas las matrices que se consideran en este parrágrafo se su- 
ponen cuadradas y de un mismo orden n. Los elementos de estas 
matrices se toman de un cuerpo conmutativo K cualquiera, pero fijo. 


3.1. Semejanza de matrices. La matriz A se llama semejante a 

la matriz B, si exíste una matriz no degenerada X, tal, que 
A=X"'BX. (1) 
En este caso también suele decirse que la matriz A es la transfor- 


mada de B por X. Multiplicando la igualdad (1) a la izquierda por 
XA y a la derecha por X”', obtenemos 


B=XAX-""=(X-*)"1 AX=". 
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Por consiguiente, la semejanza de A con B implica la semejanza de 
R rm A. Además, si 


A=X"BX y B=Y"'CY, 
realizando la sustitución obtenemos 
A =(YX)"'C(YX). 


Por consiguiente, dos matrices, semejantes cada una a otra tercera, 
sin también semejantes. Es obvio, finaimente, que toda matriz es 
semejante a sí misma. 

Estas propiedades demuestran que el conjunto de todas las ma- 
trices cuadradas de un orden dado s., formadas por elementos du un 
cuerpo conmutativo K, se descompone de un modo natural en clases 
de matrices semejantes. Uno de los problemas centrales de la teoría 
de matrices es el de hallar las condiciones necesarias y suficientes 
de semejanza de matrices. La solución de este problema será dada 
en el capitulo 1V. Aquí estableceremos solamente algunas propieda- 
des previas de matrices semejantes. 

Para transformar una suma de malrices por X es suficiente trans- 
formar por X cada sumando, 

En efecto, 


XMUA, +A +. FAJA =X UA XX TA AR. A TIA XK. 


Para transformar un producto de matrices por X es suficiente 
transformar cada factur 
Efectivamente, 


XA X XA... XA X=X ALA, ... AX, 


ya que los productos XX”!, que aparecen en el primer miembro, 
son iguales a E y pueden ser omitidos. 

Para transformar una potencia de una matriz es suficiente trans- 
formar la base de la potencia, es decir, se tiene 


ATACX =(X AX)". 
Si m>0, esta fórmula es un caso particular de la anterior. SI 
m< 0, tomemos £=-— mm. Entonces tendremos 
XAAPMX =XU (ATSON?X =(X 7 ATI XYP =(X 71 AX)" =(X7* AX)”. 
El valor transformado de un polinomio en una matriz es igual 
al valor del polinomio en la matriz transformada, en otras palabras, 
XA U(A)X=f(X=* AX). 
Esta proposición es resultado inmediato de las anteriores, ya 
que el valor de un polinomio en A se obtiene a partir de A rea- 


lizando operaciones de elevación a potencias, de multiplicación por 
número y de adición. 
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Las reglas de la transformación de expresiones permiten en mu- 
chas ocasiones simplificar considerablemente los cálculos. Sean, por 


ejemplo, R 
l l 
A=|0 ¡| y x=|3 2)- 


Por inducción es fácil demostrar que 


Puesto que 
xAx=[_o _gl. 
tendremos, aplicando la regla de transformación de una potencia, 


7 AN A l + 6n Jn 
lo sl = XA x=| —9n E 


3.2. Polinomio característico. Sea A una matriz cuadrada y sean 
aji j¡=1, 2, ..., 1) sus elementos. La matriz 


A— UA, “—Eie e... — Urna 
TE= AS — 01 ?. — Oya c.. Ty 


donde 4 es una variable independiente, se llama matriz característica 
de A. Su determinante 
y 0) =|AE—=A| (1) 


es evidentemente un polinomio en 4 y se llama polinomio caracte: 
ristico de la matriz A 

Para hallar dos primeros términos de este polinomio recurramos 
a que el valor de un determinante es igual a la suma de los pro- 
ductos de sus elementos tomados de modo que haya uno de cada 
fila y uno de cada columna y provistos de signo adecuado. Para 
hallar el término de mayor grado respecto a A es necesario tomar 
los productos du los elementos de mayor grado. Es nuestro caso este 
producto será uno solamente, a saber, el producto (A—a, ,)(A—%p) -.. 

. (A—Ann) de los elementos diagonales. Todos los demás productos 
que componen el determinante serán de grado no mayor que 2—2, 
ya que siendo —a;, (i5* j) uno de los factores de alguno de estos 
productos, el último no contendrá los factores A—a,; y A—a), y, 
por So será de grado no mayor que n—2. De este modo, 
(A) =(A—G,,) -.. (A—=%,,) + términos de grado no mayor que 


n—2, 0 
g(A)=A—(A +... FAA) A 7 th... (2) 
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La suma de los elementos diagonales de una matriz se llama 
traza de la matriz. Según la fórmula (2), el grado del polinomio 
característico de una matriz es igual al orden de esta matriz, el coue- 
ficiente principal del polinomio característico es igual a I, mientras 
que el coeficiente de 4"! es ¡igual a la traza de la matriz tomada 
con el signo contrario. Si en la fórmula (2) tomamos A = 0, tendremos 


p(0)=|—A|=(—1)"1 4]. 


Pero (0) es el término independiente del polinomio característico. 
Es decir, el término independiente del polinomio característico de 
una matriz A es igual al determinante de esta matriz multiplicado 
por (—1)", donde n es el orden de la matriz A. 

El teorermma que sigue describe una de las propiedades niá: im- 
portantes del polinomio característico. 

TEOREMA 1. Los polinomios característicos de matrices semejantes 
coinciden. 

En efecto, sea A una matriz semejante a la matriz B: 


A=X1BX. 
Entonces para el polinomio característico de A tenemos 
NMNE=A|=pE=X""BX|=]X“"QE—=5b)X|=|X7*|-|1E—B]-|X ]. 


Los determinantes |X”!]| y |X| son números recíprocos cuyo 
producto es igual a la 1; por esto, se tiene 


AE—B|u=JAE—A| 


que es lo que se quería demostrar. 

De este teorema se deduce, en particular, que /as matrices se- 
mejantes tienen trazas y delerminantes iguales, ya que la traza y el 
determinante de una matriz, provistos de signo adecuado, son coe- 
ficientes de su polinomio característico. 

La igualdad de Jos polinomios característicos es una condición 
necesaria pero, como regla general, no suficiente de la semejanza 
de matrices. Por ejemplo, los polinomios característicos de las 


matrices ió id 
E=|, ¡| y a=l0 1 


coinciden. Sin embargo, A no puede ser semejante a £ ya que para 
cualquier matriz X se tiene 


XMEX=X"X=E. 
Las raíces del polinomio característico de una matriz se llaman 
números característicos o valores propios de la misma. Las raíces 


múltiples del polinomio característico se llaman valores propios 
múltiples de la matriz. Es conocido que la suma de todas las raíces 
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reales y complejas de un polinomio de grado n, cuyo coeficiente prin- 
cipal es la 1, es igual al coeficiente de la (rr — 1)-ésima potencia de la 
variable tomado con el signo contrario. De la fórmula (2) resulta, 
por ello, que en el cuerpo de los números complejos la suma de todos 
los valores propios de una matriz es igual a su traza. 

Observemos que la traza de una suma de matrices es igual a la 
suma de las trazas de los sumandos y que la traza del producto de 
un número por una matriz es igual al producto de este número por 
la traza de la matriz. Ambas afirmaciones pueden ser resumidas en 
una fórmula: 


traza (a A + BB) =0.-traza A + P traza B 


para cuya demostración basta considerar las matrices correspondien- 
tes y calcular sus trazas. 

En el p. 1.2 a todo polinomio A) ha sido puesta en corres- 
pooR una matriz 94%) llamada salor del polinomio (A) para 

=A. Si p(A)=0, se dice que Á e: raíz de q(h). 

TEOREMA DE HAMILTON-CAYLEY. Toda matriz es raíz de su polino- 
mio característico. 

Sea A una matriz. Sea B la matriz adjunta de la matriz carac- 
terística AE— A (véase el p. 2.3). Sean B,, (i, j=1,2, ..., n) los 
elementos de la matriz B. Estos elementos son los adjuntos del 
determinante |A£— A] y, por lo tanto, representan polinomios en 
A de grado no superior a n— 1. Sea 


By =BP BPE E BA orA ra, 
Consideremos las matrices numéricas auxiliares 


pr (R) Ut) >> 
11 1. ..- 1n | 


pr «%) (2) 
B'= e Ae a 00 (k=0, L cda n—1). 
nn 0 


Es evidente que la matriz B puede ser representada en este caso 
en la forma siguiente: 


B=B +4B0 +... $10 1g0m0-0, 


En virtud de la propiedad principal de las rmatrices adjuntas, se 
tiene 


BQE—A)=|AME—A]-E. (3) 


Aquí JAE—A] es el polinomio característico de la matriz A que 
representaremos mediante q (A). Sea 


p(A)=a a+... api A, 
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Ahora podemos escribir la igualdad (3) en forma más detallada: 
(BO FAB" + de $ 471Bw=0) (AE — A) = 
= (0 + 2GAR...+0,-¡477!1 447) E. 


Suprimiendo Jos paréntesis y comparando los coeficientes de po- 
tencias iguales de A, obtenemos 


—BWA =0É, 
—BWAYB"W =0,É, 
—BYWA + Bu a HE; 
—BUTVA Y Bu a, E, 
E. 


Multipliquemos a la derecha estas igualdades por E, 4, ..., A”, 
respectivamente, y sumémoslas. Todos los términos del primer 
miembro se anularán y obtendremos 


O=0,—E+0 A+ AR. ..+A”, 
es decir, p(A)=0 que es lo que se quería. 


3.3. Polinomio mínimo. Consideremos todos los polinomios no 
nulos F(A) para los cuales una matriz A dada es una raíz. Existen 
polinomios de este tipo; entre ellos figura, por ejemplo, el polino- 
mio característico de la matriz 4. El polinomio no nulo de menor 
grado y de coeficiente principal igual a la 1, para el cual la ma- 
triz A es una raíz, se llama polinomio mínimo de esta matriz. 

« Toda matriz A tiene sólo un polinomio mínimo. En efecto, si hubiese 
dos, digamos y, (A) y w, (A), la diferencia y, (A) —+v, (A) sería un 
polinomio no nulo de grado menor, para el cual la matriz A tam- 
bién sería una raiz. Dividiendo esta diferencia por su coeficiente 
principal, tendríamos. un polinomio de coeficiente principal igual 
a la 1, la matriz A sería una de sus raíces y su grado sería infe- 
rior al de los polinomios minimos wv,(A) y p, (A), lo cual estaría 
en contradicción con ta definición de los polinomios minimos. 

Todo polinomio f(A) para el cual la matriz A es una raiz es 
divisible por el polinomio minimo wp(A) de esta matriz. 

Efectivamente, supongamos, al contrario, que f(4) no es divi- 
sible por yp(A). Designando mediante g(A) el cociente y mediante 
r(A) el resto de la división de f (+) por y(%), tendremos 


PA) =p (4) q (4) +7 (4). 


Tomando aquí A=A y valiéndonos de que p(4)=f(4)=0, 
obtendremos r(4)=0. Pero el grado del resto r(/) es menor que 
el grado del divisor (A). Por consiguiente, r(A) es un polinomio 
no nulo, la matriz A es su raiz y su grado es inferior ul grado 
del polinomio mínimo y:(4), lo cual es contradictorio. Hemos 
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demostrado nuestra afirmación. En particular, el polinomio minimo 
de una matriz es un divisor de su polinomio característico, 

Sabemos que las matrices semejantes tienen un mismo polinomio 
característico. Esta misma propiedad la tiene el polinomio mínimo: 
las matrices semejantes tienen polinomios mínimos idénticos. En 
efecto, sea A semejente a B: A=X"*BX. Si f(A) es un polinomio 
que tiene a B como raíz, tendremos en virtud del p. 3.1 


HA) =f(XBX)=X7*f(B)X =0. 


Por consiguiente, el conjunto de polinomios que tienen como raíz 
una de las matrices semejantes coincide con el conjunto de polino- 
mios que tienen como raiz otra de las matrices semejantes. Por 
esto, el polinomio de grado menor y de coeficiente principal igual 
a da l, perteneciente a este conjunto, será el polinomio mínimo de 
ambas matrices. 

La igualdad de los polinomios mínimos es una condición nece- 
saria más de la semejanza de matrices. Sin embargo, esta condición 
tampoco es suficiente. Consideremos por ejemplo, las matrices 


200 200 
A=|030| y B=|020|]: 
003 003 


Sus polinomios característicos son iguales, respectivamente, a 
A—2(1—3? y 0—2)(4—3). 


Puesto que estos polinomios son diferentes, las matrices A y 
B no son seniejantes. El polinomio mínimo de la matriz A debe 
ser divisor de su polinomio característico, es decir, debe coincidir 
con uno de los polinomios siguientes: A—2, A—3, (A—3)!, 
(A1—2)(4—3) o (A—2)(A—3). Tomando aquí en lugar de A la 
matriz A, encontraremos que el cero se obtiene por primera vez 
en el caso del polinomio (A—2) (1—3). Por consiguiente, este poli- 
nomio será precisamente el polinomio minimo de la matriz A. 
De la misma forma determinaremos que el polinomio minimo de 
la matriz B es también el polinomio (A—2)(1—3). Es decir, dos 
polinomios minimos de las matrices A y B coinciden, mientras que 
las matrices A y B no son semejantes. 

En el p. 1,4 hemos dicho que las matrices de tipo 


SA, a 
A, 
A= : ; 


$ 3. Polinomios característico y minimo 65 


donde A,, ..., A, son matrices cuadradas, se llaman descompuestas 
en células A,, ..., A, O descompuestas en la suma directa de estas 
células. 

El polinomio característico de una matriz descompuesta es 
igual al producto de los polinomios característicos de sus células 
diagonales. 


En efecto, si A se descompone en células A,, ..., A,, es fácil 
ver que su matriz característica es de la forma 
PAE,—A, 1 
AE —A, 
AE — A = : , 
L AE—A, 
donde E,,..., E, son las matrices unidades de ordenes correspon- 


dientes. Se sabe del p. 2.1 que el determinante de una matriz des- 
compuesta es igual al producto de los determinantes de sus células 
diagonales. Por consiguiente, 


PLE—A|=/|2£,—4,]-lAE,—A, |... |AE,—A,! 


que es lo que se quería demostrar. 

El polinomio mínimo de una matriz descompuesta es igual al 
minimo común múltiplo de los polinomios mínimos de sus células 
diagonales. 

Supongamos que la matriz A se descompone en las células 
A. ..., As. Sean p,(A), ..., ps(A) sus polinomios mínimos res: 
pectivos. Consideremos un polinomio arbitrario f(A). Si f(A)=0, 
de la fórmula (7) del p. 1.4 resulta que f(A,)=... =f(A,)=0. 
Pero todo polinomio que tiene como raíz a la matriz A, es divi: 
sible por el potinomio mínimo w,(A) de esta matriz. Por consiguiente, 
F(A) es un común múltiplo de los polinomios +, (A), ..., y (4). 
Viceversa, si un polinomio cualquiera f(A) es un común mú tiplo 
de y, (0), ..., p, (4), se tiene evidentemente f(4)=0. Por consi- 
guiente, para obtener el polinomio mínimo de ta matriz A es pre- 
ciso tomar el común muúltiplo de menor grado de los polinomios 
PL(A), -.., ps (A), es decir, el mínimo común múltiplo, que es lo 
que se quería demostrar. 

Una matriz celular A se llama semidescompuesta o celular trian- 
gular, si todas sus células diagonales scn cuadradas, mientras que 
las células que figuran a un lado cualquiera de la diagonal princi- 
pal están formadas por ceros. En lo sucesivo siempre aceptaremos 
que las células nulas de la matriz semidescompuesta se hallan 
sobre la diagonal principal. Por consiguiente, las matrices celulares 


9—1843 
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semidescompuestas tienen la estructura siguiente 


A Án As (1) 


donde A,,, ..., A,, son células cuadradas y todas las células que 
se hallan encima de éstas están formadas por ceros. 

Sea B otra matriz semidescompuesta cualquiera, cuyas células 
diagonales son del mismo orden que las células correspondientes de 
la matriz A. En virtud de las reglas de operación con matrices 
celulares, tenemos 


LA, + Bs, Ása + Bs, aa Ass + Bos 


A A ”B,, AB 
Án Áss 4 Ba, Ba = Cu AnBn : 


LAs, As: ces Ass 3 LBs, Bs; ... Bss L Cs Ca q e AsBs;_ 


donde C,¿=A,Bjy¡+ As, ¡Bar ¡+ + + A1Bi¿ Por consiguiente, 
la suma y el producto de matrices semidescompuestas son matrices 
semidescompuestas cuyas células diagonales son iguales a las sumas 
y a los productos de las células correspondientes de las matrices dadas. 
En particualr, si f(A) es un polinomio en A y Á es una matriz 
semidescompuesta de tipo (1), se tiene 


FLA, 


) a 
¿ls FA.) | (2) 


Dar D,, e (Ass) 


(las células D,, tienen una estructura más compleja). Del $ 2 cono- 
cemos que el determinante de una matriz semidescompuesta es igual 
al producto de los determinantes de sus células diagonales. 

De aquí se deduce directamente que el polinomio característico 
de una matriz semidescompuesta es igual al producto de los polino- 
mios característicos de las células diagonales de esta matriz. 

Si las células de una matriz semidescompuesta A son de orden I, 
se dice que A tiene forma triangular o, simplemente, que es una 
matriz triangular. Los valores propios de una matriz triangular son 
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iguales a sus elementos diagonales. De las fórmulas (2) resulta tam- 
bién que siendo E,, €, ..., E, los valores propios de una matriz 
triangular, los valores propios de la matriz f(A) serán f(t,), 


FE), +.» FEn)- 


Ejemplos y problemas 


l. Una matriz se llama nllpotente si una de sus potencias es Igual a Ja 
matriz nuja. Demuéstrese que una matriz semidescompuesta es niipotente st, 
y sólo si, son nilpotentes sus células diagonales. 

2. Empleando el teorema de Hamilton-Cayley demuéstrese que si en el cuerpo 
de los números complejos todos los valores propios de una matriz son iguales 
a cero, la matriz es nilpotente. 

3. Demuéstrese que si en la suma directa de matrices se cambian entre sí 
los sumandos, la suma nueva será una matriz semejante a la suma inicial. 

4, Calcúlense los polinomios característicos y las valores propios de las 


matrices 
123 
23 E cos qu sen a 
Am | 4]: nl Bd Sell y o [213]. 


6. Hállense los polinomios mínimos de Jas matrices 


2000 
osj» |930/- [031 y [0030 
003 0 0003 
6. Demuéstrese que los valores propios de una matriz diagonal son sus ele- 


mentos diagonales. 
7 Demuéstrese la fórmula 


traza (AB) == traza (BA). 
8. Si en una matriz cuadrada de orden n se suprimen m filas con los nú- 
meros ¿z, la, .«.» Ip y m columnas con los mismos números, quedará una matriz 


de orden n—m y su determinante se llama menor principal de orden n—. 
Demuéstrese que el cocticiente de 1% en el polinomio característico de la matriz 
Á es E a a suma de sus menores principales de orden rn—m multiplicada 
or (—1)*-*, 
, 5 Demuéstrese que el polinomio característico de la matriz AB colncide 
con el polinomio característico de la matriz BA. 

10. Si £,, Ea» .-., En son los valores propios de una matriz A, los valores 
pops de id F(A). donde F(A) es un polinomio, serán iguales a f ([,), 
( 2) .s..p ( n)- 
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$ 4. Dimensión 


4.1. Módulos y espacios vectoriales. Un conjunto arbitrario no 


vacio de elementos Y se llama módulo sobre un anillo K, si se 
cumplen las condiciones siguientes: 

a) existe una regla que a partir de cualquier par de elementos 
a y bde £ permite hallar un elemento de Y que se llama suma 
de los dos primeros y se designa mediante a + b; 

b) existe una regla que a par de cualquier número a de K 
y de cualquier elemento a de * permite hallar en Y un elemento 
nuevo que se Jlama producto de a por a y que se designa me- 
diante aa; 


c) las operaciones de adición y de multiplicación por número 
satisfacen los axjomas siguientes: 
1” la adición es conmutativa: 


a++b=b>w+a; 
2” la adición es asociativa: 
a+ (b+c)=(a4+b)+c; 


3” es posible realizar la sustracción, es decir, para todo par de 
elementos a y b de % existe en Y un elemento x tal que 


a+ x=b; 
4? la multiplicación es asociativa: 
a (Ba) e (2P) a; 
5” la multiplicación es distributiva respecto a la adición en *£: 
a (Aa + 6) = an + ab; 
6” la multiplicación es distributiva respecto a la adición de 


números: 
(a +8) a =aax + pa. 
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Si el anillo K está provisto del elemento unidad 1, suele exi- 
girse que se cumpla además la condición 


7 lla=a (a€l). 


En este caso el módulo se llama unitario. Un módulo unitario sobre 
un cuerpo K se llama espacio lineal o vectorial sobre K. Los ele- 
mentos de los módulos y de los espacios vectoriales se llaman vec- 
tores y en lo que sigue se representan con letras latinas minúscu- 
las a, b, x, y, ... Los espacios lineales y los E TN de vecto- 
res se representarán con letras góticas mayúsculas A, B, 2, M, ... 

En la definición dada más arriba los vectores se multiplica 
a la izquierda por los elementos del anillo K. Por esta razón, 
los módulos y espacios definidos más arriba se llaman tam- 
bién módulos a la izquierda y espacios a la izquierda sobre K. 
Si se exige que estén definidos los productos a la derecha de los 
elementos de £ por los elementos de K y si se modifican de 
modo correspondiente los axiomas de 4% a 7”, se obtendrá una es- 
tructura que se llama módulo a la derecha y, respectivamente, 
espacio lineal a la derecha. Está claro que las propiedades de los 
espacios a la izquierda y a la derecha son las mismas; tiene impor- 
tancia distinguir la multiplicación a la izquierda y a la derecha sólo 
cuando estén definidas simultáneamente. En lo que sigue los espa- 
cios a la izquierda sobre K se llaman simplemente espacios sobre K. 

Un espacio lineal sobre el cuerpo de los números complejos se 
llama espacio lineal complejo y un espacio lineal sobre el cuerpo 
de los números reales se llama espacio lineal real. Los ejemplos 
principales de módulos y de espacios lineales se darán más tarde, 
mientras que ahora consideraremos los corolarios más simples que 
se desprenden inmediatamente de los axiomas de 1? a 7”. 

Ante todo, la condición a) y los axiomas 2” y 3? muestran que 
todo módulo es un grupo respecto a la operación de adición de 
vectores y, además, según el axioma 1” este grupo debe ser con- 
mutativo. Por consiguiente, igual que en cualquier grupo conmuta- 
tivo, la suma de un número finito de vectores no depende ni del 
orden de los sumandos de esta suma ni de la forma en la que 
están dispuestos los paréntesis. Por ejemplo, 


(a+0) +(c+d) =0+ (a+ (d+b)). 


Además, entre los vectores de un módulo arbitrario existe, al 
igual que en todo grupo aditivo, un único vector — designémoslo 
mediante o—que posee la propiedad de que 


x+o=0+x=x 
cualquiera que sea el vector x del módulo considerado. El vector 


o se llama vector nulo o simplemente cero del módulo. Además, 
para todo vector a del módulo Y existe en el último un vector y, 
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y sólo uno, que satisface la ecuación 
a+ y =0. 


Este vector y se indica por —a y se llama opuesto de a. 
De los axiomas 1”, 2” y 3” se desprende que —o=o0 y que 
para cualesquiera a y b 


—(—aj=a y —(a+b)=(—a)+(—D). 
En las expresiones de tipo (— a) +b-+(—-c) suelen omitirse los 


paréntesis escribiendo —a-+b—c. La operación binaria —, defi- 
nida mediante la fórmula 
x—y=Xx-+(— y), 


se llama operación de sustracción de vectores. El hecho de que un 
mismo simbolo indica dos operaciones diferentes (la del paso al 
vector opuesto y la operación binaria de sustracción) no originará 
en lo sucesivo ningún inconveniente. 

Hasta el momento hernos considerado sólo aquellas propiedades 
de los módulos que los caracterizan por ser ellos grupos conmuta- 
tivos respecto a la adición, es decir, aquellas propiedades que se 
desprenden de los axiomas 1”, 2 y 3”. Teniendo en cuenta los 
axiomas de 4% a 7”, obtenemos fácilmente las identidades 

0.a=o0, 
ma=a+4+...+4 
(m sumandos; m es un número entero positivo), 
(—a)-a A (aa), 
LO um Q. 


En efecto, la primera es consecuencia de que 
2% (14+0)a=1-a+0.4a=a+0-4; 
la segunda se demuestra de modo siguiente: 
ma=(1l+...+la=l!.a+...+1.a=0a+...-+0. 
Luego, puesto que 
aa + (— a)a=(a—a) a=0, 


se tiene (—a)a=-— (ua). Finalmente, la cuarta igualdad es conse- 
cuencia de que 


Aa:-0+ad=a(0+a) =aa. 


Observemos también que, siendo K un cuerpo, de ax =0 se deduce 
que o bien a=0 o bien ao. En efecto, si a +0, multiplicando 
la relación a«a=0 por a”' obtenemos a ==0, 
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Las expresiones de tipo 


AA, + 244, H ... + 0,0, 
se llaman combinaciones lineales de los vectores Q,, 4,, ..., 4,. De 
nuestras consideraciones se desprende que las combinaciones linea- 
les pueden ser sumadas, restadas y multiplicadas por números y 
que en ellas se pueden reducir los términos semejantes siguiendo 
las reglas habituales. 

El ejemplo más conocido de un espacio lineal es el conjunto de 
los segmentos orientados que parten de un punto fijo O de nuestro 
espacio habitual. Multiplicar un segmento por un número real po- 
sitivo a significa aumentar su longitud «a veces sin alterar su di- 
rección. Si a es negativo, la multiplicación de un segmento por « 
significa que su longitud aumenta |a| veces y que su dirección 
cambia por la contraria. Análogamente, sumar dos segmentos sig- 
nifica tomar la diagonal del paralelogramo construido a partir de 
estos segmentos. El vector nulo será el segmento, cuyo origen y 
extremo coinciden con el punto O. Puesto que la operación de 
multiplicación de un segmento por un número está definida sólo 
para los números reales, el campo principal K es en este caso el 
cuerpo de todos los números reales y el espacio de segmentos orien- 
tados es un espacio lineal real. Lo llamaremos siempre espacio de 
vectores-segmentos corrientes y lo indicaremos por *R. 

Un ejemplo más general de espacios lineales, y además básico 
para toda la teoria de los mismos, es el espacio de filas. Conside- 
remos el conjunto de todas las sucesiones de tipo [«,, %,, ..., %,), 
donde «,, ..., «, son números de un cuerpo K y n es un número 
entero dado. También llamaremos estas sucesiones filas, considerán- 
dolas como matrices compuestas de una fila. Dos filas se llaman 
iguales si son iguales sus elementos respectivos. Las operaciones de 
adición de fitas y de multiplicación de filas por un número se de- 
finen mediante, las fórmulas matriciales correspondientes: 


B [a,, ...> a.) = [Pa,, A Ba), 
[(%,, Gp ..., 0%.) + [B,, B., ...» P,) al 
=[(a,+8,, A, + Ba, .... Ga "E Pn)- 


Está claro que en este caso los axiomas de 1? a 7” se cumplen y 
que el conjunto de todas las filas de longitud n formadas por 
elementos de un cuerpo K es un espacio lineal sobre K. Siendo K 
un anillo cualquiera, obtenemos un ejemplo de un módulo sobre K. 
En lugar de filas se pueden considerar matrices de un número 
cualquiera, pero fijo, de filas y de columnas con elementos de un 
anillo K. De acuerdo con las reglas del cálculo de matrices, cual- 
uier matriz de este tipo puede ser multiplicada por un número de 
k y cualesquiera dos pueden ser sumadas, obteniéndose ambas ve- 
ces una matriz del mismo tipo. Es obvio que los axiomas de 1” a 
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7” también se cumplen aquí y, por consiguiente, las matrices de m 
filas y de n columnas constituyen, respecto a las operaciones de 
adición y de multiplicación por número, un módulo sobre X o un 
espacio lineal, si R es un cuerpo. 

Consideremos un ejemplo más. Sea M un conjunto arbitrario de 
cualesquiera elementos 2 sea K un anillo. Supongamos que tene- 
mos a nuestra disposición una ley que pone en correspondencia a 
cada elemento m de MD un número determinado de K. Toda ley de 
esta índole se llama finción definida sobre el conjunto Wi y con 
valores en K. Si la función se indica con una letra cualquiera f, 
mediante f(m) suele indicarse el número que corresponde al ele- 
mento sn. El número f(m) se Mama valor de la función f sobre el 
elemento m. Dos funciones f y g que satisfacen la igualdad f (m) = 
= g(m) cualquiera que sea m de Wi, se llaman iguales. Para las 
funciones definidas sobre Mi se pueden introducir de modo habi- 
tual las operaciones de multiplicación por número, de adición y de 
multiplicación de funciones. Por ejemplo, dados un número a y 
una función f y poniendo en correspondencia a cada elemento m 
de Y? el número «af (m), obtenemos una función nueva que se llama 
producto del número a por la función f. Análogamente se definen 
la suma y el producto de dos funciones. Si consideramos sólo las 
dos primeras de estas operaciones ——la multiplicación por número 
y la adición— es fácil ver que se cumplen los axiomas de un mo- 
dulo. Por consiguiente, el conjunto de todas las funciones, defini- 
das sobre un conjunto dado M y con valores en un anillo K, 
constituye un módulo sobre K. Siendo el anilio inicial un cuerpo, 
obtenemos, al igual que antesiormente, un ejemplo de espacio vec- 
torial.. 

En el caso en que M consta de un número finito de elemen- 
tos, se puede introducir una notación cómoda para las funciones 
definidas sobre Vi. Sean m,, Mm, ..., m, los elementos del con- 
junto M. Indiquemos mediante (m,] la función que es igual a 1, sob- 
rem, e igual a O sobre todos los demás elementos de Mi (¿=1,..., 

..» S). En estas condiciones el producto «a (+m,)] será la función 
igual a a sobre m, e igual a 0 sobre todos los demás elementos 
de M y la expresión 


a, [m,)] +0, (m,) +... +4, [m,] (1) 
será, obviamente, la función que es igual a a, sobre m,, a Q, so- 
bre m,, ..., a a, sobre m,. Por consiguiente, toda función defini- 


da sobre Mi puede ser representada en la forma (1) y esta repre- 
sentación, como es fácil ver, es única. Si no existe el peligro de 
confusión, los paréntesis en (1) suelen omitirse y en lugar de (1) 
suele escribirse brevemente: 


QM, HUME... OM, 


$ 14. Dimensión 73 


con la particularidad de que los términos de coeficientes nulos no 
se escriben. Por ejemplo, si Yi se compone de las letras a, b y c, 


la expresión 2a—c significa la función que es igual a 2 sobre a, 
a cero sobre b y a —1 sobre c. 


4.2. Dependencia lineal. Sea Y un espacio vectorial sobre un 


cuerpo de coeficientes K y sean A,, %a, ..., A, unos vectores de 
este espacio. La relación de tipo 


a414,+090+... +% 50 =0, 


donde «,, ..., %, son números de K, se llama relación de depen- 
dencia lineal entre los vectores a,, ..., An. Si todos los coeficien- 
tes %,, ..., %, son jguales a cero, la relación se llama trivial. 


En el caso contrario, es decir, si al menos uno de tos coeficientes 
es diferente de cero, la relación se ilama no trivial. Está claro que 
una relación trivial] existe entre cualesquiera vectores. La respuesta 
a la pregunta sobre si existe o no una relación no trivial, depen- 
de de los vectores que se consideran. Por ejemplo, en el espacio de 
filas de longitud tres entre los vectores a=[1, 4, 6], b=[1, —1, 1] 
y ¿=[!, l, 3] existe la siguiente relación de dependencia lineal 


2a+3b— 5 =0. 


Por otra parte, en este mismo espacio no existe ninguna relación 
no trivial entre los vectores e,=[l, 0, 0], e,=(0, 1, 0] y 
e, =[0, 0, 1] ya que la relación 


Ay€, + Ugly + Age] =0 


(%,, %, a] == [0, 0, 0], 


significa que 


de donde se tiene 
a, = Ag = %y aa 0. 


Un sistema finito de vectores Q,, Az, ..., Gp de un espacio [tneal 
se llama linealmente dependiente, si entre ellos existe una relación 
no trivial. 


Si no existe tal relación, es decir, si de toda relación de tipo 
0, + A+... +A, =0 
se deduce que a, =%,=...=G,=0, el sistema Q,, Aj ..., QA Se 
llama linzalmente independiente. 
De esta definición se deduce inmediatamente que si a un síste- 
ma linealmente dependiente de vectores 4,, Az, ..., O, se agregan 


otros vectores b,, ..., by, el sistema ampliado seguirá siendo lineal- 
mente dependiente. En efecto, sí 


A%,A, + Gl +... 4% gl =0 
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es una relación no trivial entre a,, ..., 4, tendremos que 
A+... +04 + 0:b,+...+0-b,=0 
será una relación no trivial entre a,, ..., €, Ú,, 


b,. 

En los problemas relacionados con la dependencia 'Íineal el vec- 
tor nulo o ocupa una posición especial debido a que todo sistema 
que contenga el vector nulo es linealmente dependiente. Para de- 
mostrar esta afirmación basta observar que la relación 


l-0+0.4,+...+0:.0,=0 


es una relación no trivial lali que sean Q,, ..., 

La definición que hemos dado de dependencia lineal de un sis- 
tema presupone que dicho sistema contiene un número finito de 
vectores, Sin embargo, resulta necesario, con frecuencia, considerar 
también sistemas infinitos. Diremos que un sistema infinito de vec- 
tores es linealmente dependiente, si resulta linealmente dependiente 
alguna parte suya finita. El siguiente ejemplo muestra que pueden 
existir sistemas infinitos linealmente independientes de vectores. 
Consideremos el conjunto de todos los polinomios en letra A con 
coeficientes de un cuerpo K. Respecto a las operaciones de adición 
y de multiplicación por números de K, estos polinomios forman, 
evidentemente, un espacio lineal. Los polinomios 


O A 
constituyen un sistema linealmente independiente en este espacio. 
Efectivamente, cualquier parte finita suya 
TN 
(0<m, <m,<...< my) 
es linealmente independiente, ya que de 


E 
se deduce que a, ==... =4)=0. 
Consideremos un espacio lineal arbitrario Y. Si un vector a de 
este espacio puede ser representado en la forma 


a=0,8, + 0,0,+... +% pl 


se dice que a se expresa linealmente en términos de Q,, Ga ..., Gm 
o que a depende linealmente de Q,,..., An. 

Si los vectores Q;,, ..., Q, Se expresan linealmente en términos 
de b,, ...,d,Y 0, ..., D, se expresan linealmente en téminos de 
a “ ..s Cp, LOS DECÍOFeS A,, ... 4, Se expresan linealmente en términos 

A 
Para la demostración basta en las expresiones lineales de los vectores 
Q,, ..., G, en términos de b,, ..., 6, sustituir 6,, ... 6, por sus 
expresiones en términos de c,, ...,c, y reducir los términos seme- 
jantes 


” 
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TEOREMA ). Sí un sistema de vectores no nulos Q,, Uy, ...» An 
considerados en un orden determinado es linealmente dependiente, al 
menos uno de estos vectores puede ser expresado linealmente en tér- 
minos de los anteriores. Reciprocamente, si uno de los vectores de 
esta sucesión se expresa linealmente en términos de los anteriores, el 
sistema es linealmente dependiente. 

Supongamos que entre los vectores a,, a,, ..., 4, €xiste una 
relación no trivial 


%4+A4MÍH... + Ag 20. (1) 


Sea a, el último coeficiente diferente de cero. Si k=1, la relación 
(1) se convierte en 


a,ad,=0 (a, 0), 


de donde a,=0 a pesar de haber aceptado que el sistema no con- 
tiene vectores nulos. Por consiguiente, 1<k<m y la relación (1) 
puede ser representada én la forma 


2/0,+-..-+040¿=0 (a, >=0), 
de donde se tiene 
2¿=—az',0,—... —0Aj Ago ¡Ar ¡> 


Con esto queda demostrada la primera parte det teorema. La afir- 
mación recíproca es evidente. 

Sea M un conjunto de vectores de un espacio lineal Y. Un 
sisteme de vectores a,, 4, ... de este conjunto se llama sistema de 
generadores de Wi, si todo vector de M puede ser expresado lineal- 
mente en términos de un número finito de los vectores a,, ds, ... 
Un sistema linealmente independiente de generadores de WÍ se llama 
base del conjunto Di. Por ejemplo, en el espacio de todos los poli- 
nomios en A los polinomios 


LALA. (2) 


constituyen una base ya que estos polinomios, como hemos visto, 
son linealmente independientes y, por otro lado, todo polinomio es 
de la forma 


E E A SR 


es decir, se expresa linealmente en términos de 1, A, ..., A”. 

LEMA Si un sistema de generadores a,, A,, ... de un conjunto 
Wi contiene un elemento a, que puede ser expresado linealmente en 
iérminos de los demás generadores, entonces suprimiendo a, en el 
sistema de generadores se obtiene de nuevo un sistema de generado- 
res de M. 

En efecto, por hipótesis todo vector de Wi es una combinación 
lineal de un número finito de generadores. Sustituyendo en estas 
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combinaciones el vector a, por su expresión en términos de los 
demás generadores obtendremos para cualquier elemento de WM una 
expresión en términos de los generadores diferentes de a, que es lo 
que se quería demostrar. 

TEOREMA 2 De todo sistema de generadores de un espacio Y se 
puede extraer una base de este espacio. 

Supongamos que £ tjene un sistema finito de generadores 


A,, %,, -.., Qs Omitiendo en este sisterna todos los vectores que se 
expresan linealmente en términos de los anteriores, obtendremos un 
sistema de vectores a,, 4;,, ... Qi, que, de acuerdo con el lema, 


será aun un sistema de generadores del espacio £. Puesto que nin- 
gún vector de este último sistema puede ser expresado linealmente 
en términos de los anteriores, este sistema es, en virtud del teore- 
ma 1, linealmente independiente y, por lo tanto, es una base del . 
espacio. 


Hemos demostrado el teorema 2 aceptando que el sistema de generadores 
contiene un número finito de elementos. Sin embargo, este teorema es válido 
también en el caso de un sistema infinito de generadores. Para la demostración 
es suficiente disponer los generadores en una sucesión translinita ay, Gs, .... Go. 
Guw+1 +. - y omitir en ella todos los elementos que se expresan linealmente en 
términos de los anteriores. 


Sea 4, 4%, ... una base del espacio *. Según la definición de 
una base, todo vector de * se expresa linealmente en términos de 
un número finito de vectores básicos. Demostremos que esta repre- 
sentación es única. En efecto, sea 


a=0,4, +00,+... + 0,0, 


a=P,0, + P,4, + ... +P,4,. 
Restando obtenemos 


o=(a, —P,) a, +(0, —P,) a, + e... + (a, —B,) as. 


Como a,, 4,, ... son linealmente independientes, se tiene «, —fP, =0, 
a —P,=0, ... a,—P,=0, es decir, a, =P,, ..., 4,=B,, que es 
lo que se quería demostrar. 

Si un espacio lineal * tiene al menos una base compuesta por 
un número finito de elementos, se dice que € es de dimensión finita. 
Con más detalle, * se llama de dimensión finita si se puede escoger 
en £ un sistema linealmente independiente finito de vectores, tal, 
que todos los vectores de Y se expresan linealmente en términos 
de este sistema. 

El concepto de base no se puede aplicar al espacio nulo. Sin 
lcd aceptaremos que el espacio nulo es también de dimensión 
inita. 

TEOREMA 3. Todas las bases de un espacio lineal no nulo % de 
dimensión finita constan de un mismo número finito de vectores. Este 


y sea 
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amero se llama dimensión del espacio Y. La dimensión del espacio 
nulo es, por definición, el número cero. 

Según la definición, en € existe una base que consta de un 
número finito de vectores. Sea 


a > (3) 


esta base. Demostremos que el número de vectores de otra base 
cualquiera 


Mo a o Mio (4 
no puede ser mayor que rn. En efecto, consideremos el sistema 
A A. (9) 


Puesto que el sistema (3) es un sistema de generadores de £, es 
decir, todo vector de * se expresa linealmente en términos de los 
vectores (3), también el sistema (5) tendrá esta propiedad. Sin 
embargo, el sistema (5) es linealmente dependiente, ya que su primer 
vector x, puede ser expresado linealmente en términos de los res- 
tantes. Aplicando a la sucesión (5) el teorema 3, vemos que un: 
de los vectores de esta sucesión, digamos a,, debe expresarse lineal- 
mente en términos de los anteriores. Omitiendo en (5) el vector a,, 
obtendremos una sucesión nueva 


a odas (6) 


donde a;, ..., 4,., representan aquellos de los vectores a,, ..., 4, 
que hemos conservado. En virtud del lema, el sistema (6) será aun 
un sistema de generadores de £, Consideremos ahora la sucesión 


X2, X1» a, 209 - (7) 


Esta sucesión es linealmente dependiente debido a que el vector x, 
se expresa linealmente en términos de sus elementos restantes. Por 
consiguiente, de acuerdo con el teorema 1 uno de los vectores de 
este sistema debe expresarse linealmente en términos de [los anterii- 
res, Este vector debe ser sólo uno de los vectores as, ..., Gp-,, ya 
que x, y x, son, por hipótesis, linealmente independientes. Omi- 
tiéndolo de la sucesión (7), obtenemos la sucesión 


X9» Xy as, e... y Ona (8) 


donde 2,, ..., 4-2 son aquellos de los vectores a;, ..., Gn.-, QUe 
hemos conservado. Puesto que la sucesión (7) era un sistema de 
generadores de *, también la sucesión (8) será, en virtud del lema, 
un sistema de generadores de Y. Agregando ahora a la sucesión (8) 
el vector x,, omitiremos de la nueva sucesión el vector que se ex- 
presa linealmente en términos de tos anteriores, etc. Sí el número 
de vectores x; fuese mayor que sn, al cabo de 1: pasos obtendríamos 
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una sucesión 
Xn Xa-=1> ....p. Xas X; (9) 


que no contendría los vectores a,, ..., a, y que sería un sistema 
de generadores de *. Esto significaria que todos los vectores del 
espacio £ podrían ser expresados linealmente en términos de los 
vectores (9). En particular, también el vector x,., podría ser ex- 
presado linealmente en términos de los vectores (9), lo que estaría 
en contradicción con la independencia lineal de Jos vectores x,, X,, ... 
Por consiguiente la base (4) no puede contener más vectores que 
la base (3), es decir, todas las bases de € constan de un número 
finito de vectores. Por otro lado, la base (3) ha sido escogida arbi- 
trariamente. Por lo tanto, con nuestro razonamiento queda demos- 
trado que el número de vectores de una base no puede ser inferior 
al número de vectores de otra base, es decir, todas las bases de L 
tienen un mismo número de vectores. 

TEOREMA 4. Cualquiera que sea un sistema linealmente indepen- 
diente a,, ..., 4, de vectores de un espacio Y de dimensión finita, se 


puede encontrar en Y unos vectores Aa,,,, .--, Q, tales, que el sistema 
Gp --+> Oy Gayys ++» 0, sea una base de 2. 
DEMOSTRACIÓN. Escojamos en £ una base cualquiera Xx,, Xy. .... 
X, y consideremos la sucesión 
A A A A A (10) 


Omitamos ahora en esta sucesión todos aquellos vectores que se ex- 
presan linealmente en términos de los anteriores. Puesto que a,, 
la -.. Ga son linealmente independientes, no será omitido ninguno 
de ellos y el sistema que resulte será de la forma 


Q,, ..«.p Cm Xi .. 93 Xy (11) 


Debido al teorema 1 este sistema es linealmente independiente. Por 
otra parte, todos los vectores del espacio % podían ser expresados 
linealmente en términos del sistema (10). En virtud del lema, la 
misma propiedad la debe tener también el sistema (11). Por con- 
siguiente, el sistema (11) es una base del espacio L y X;,, X;,, .... Xi, 
son los vectores que queríamos encontrar. 

El teorema 4 puede ser enunciado también en esta forma: todo 
sistema linealmente independiente de vectores del espacio * o bien es 
una base o bien forma parte de una base de £. 

Supongamos que £ es de dimensión n. Entonces, toda base del 
espacio Y contiene n vectores y, por consiguiente, el número de 
vectores en cualquier sistema linealmente independiente de £ es 
o menor de n o igual a nr. En el último caso el :isternma debe ser 
una base de €. En particular, el número máximo de vectores lineal- 
mente independientes de Y es igual a n, es deci, es igual a la 
dimensión de *. 
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Hemos obtenido el teorema siguiente. 

TEOREMA 5. Todo sistema de n +1 vectores de un espacio lineal 2 
de n dimensiones es linealmente dependiente. Cualesquiera n vectores 
linealmente independientes de este espacio constituyen una base del 
mismo. El número máximo de vectores linealmente independientes del 
espacio Y es igual a la dimensión de este espacio. 

Para concluir, observemos que los teoremas 3 y 4, que hemos 
enunciado para el caso de espacios de dimensión finita, tienen lugar 
también en los espacios de dimensión infi- 
nita. Solamente en lugar del número de 
vectores de una base habrá que considerar ta 
potencia del conjunto de los vectores que 
la componen y, respectivamente, la dimen- 
sión de un espacio deberá entenderse como 
la potencia del conjunto de vectores que 
forman una base cualquiera de este espa- 
cio. En cuanto al teorema 5, solamente la 


última de sus afirmaciones puede ser exten- 27 
dida directamente al caso de dimensión 
infinita. En este libro estudiaremos las Fig 1. 


o de los espacios de dimensión 

inita. Por esto, en lo sucesivo un espacio lincal se comprenderá, 
siempre que no se diga lo contrario, como un espacio lineal de di- 
mensión finita. 

Determinemos la dimension de los espacios considerados en el 
p.+.1. Sea Ji el espacio habitual de segmentos orientados que parten 
de un punto O. Como de costumbre, diremos que estos segmentos 
son vectores. Demostremos que cualesquiera fres vectores a,, 4, y 4, 
del espacio K, que parten del punto O y que no pertenecen a un 
mismo plano, constituyen una base de KM. En efecto, los vectores 
4,, A, y a, son lintalmente independientes, ya que de lo contrario 
uno de ellos, digamos a,, deberia expresarse linealmente en térmi- 
nos de los otros dos. Sin embargo, la relación a, =0,4, -+- 0,0, sig: 
nifica que a, es la diagonal del paralelogramo construido a partir 
de los vectores aa, y «zaz. Puesto que aa, y a,a, se hallan en el 
plano a,Oa,, también a, tendria que pertenecer al] mismo plano, lo 
que estaría en contradicción con la hipótesis. Por otra parte, todo 


vector OÁ del espacio D puede ser expresado linealmente en térmi- 
nos de a,, a, y as (fig. 1): 


0A= OP, + PP. + PA = (41(1, -+ Ay, + Aly, 


donde e, es la relación entre la longitud del segmento P,.,P, (P,=0, 
P,=A) y la longitud de a, tomado con el signo adecuado. Por 
consiguiente, 4a,, a, y a, es una base del espacio DH y Yi es de 
dimensión tres. 
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Análogamente se demuestra que el conjunto de vectores, que 
parten de un punto O y que pertenecen a un plano que pasa por O, 
es un espacio lineal de dos dimensiones y que el conjunto de vecto- 


res, que parten de O y que pertenecen a una recta que pasa por O, 
es un espacio de una dimensión. 


Consideremos el espacio de filas de longitud sr formadas por 
elementos de un cuerpo K. Sea 


e,=[1,0, ..., 0) 
e,=[(0, 1,..., 0), 
e, =10,0, .... 1. 
Multiplicando sucesivamente estas filas por números arbitrarios 


Li, ay ---» %, Y sumando, obtenemos 

El, HA HE Fl =(0,, Lo, ---, Un). 
Es decir, una fila arbitraria [a,, ..., a,)] se expresa linealmente en 
términos de €e,, ...,€,. Sin embargo, el sistema €,, ..., €, es line- 


almente independiente, debido a que la relación 
Al, + Ola +... +, £, =0 


[%,, %, -.-,%,)] =[0, 0, ..., 0), 


de donde se tiene a,=«,=... =4,=0. Por ello, €,, €y, ..., €, €s 
una base del espacio considerado y, por consiguiente, su dimensión 
es K. 

Finalmente, sea € el espacio de funciones definidas sobre un con- 
junto finito Wi y con valores en un cuerpo XK. Sean m,, M,, . ., M, 
los elementos de Di. Según el p. 4.1, toda función f de Y puede ser 
representada en la forma 


[=0,(m,] +a,[m,] +... +2,[(11,], 


donde (m;] es la función igual a 1 sobre m, e igual a O sobre los 
demás elementos del corijunto Wi. Es decir, f se expresa linealmente 
en términos de [m,], ..., [m,]. Por otro lado, la igualdad 


a, (m,] +0, (m4... -+a,(m,] =0 


significa que todos los valores de la función que figura en el pri- 
mer miembro son iguales a cero y, por consiguiente, =...=%, == 0, 
Vemos de esta forma que [yn,], ..., [m,] es una base del espacio £ 
y que su dimensión es igual a s. 

Hemos considerado espacios lineales es decir, modulos (unitarios) 
sobre un cuerpo K. Ejemplos muy sencillos permiten ver que para 
los módulos sobre anillis arbitrarios, e incluso sobre anillos conmu- 
tativos arbitrarios, los teoremas 1 y 2 dejan de terier lugar. Sea, 
en particular, K el anillo de los números enteros corrientes y sea Y 


implica 
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el conjunto de estos mismos números enteros en el que la operación 
de adición está definida del modo corriente y la operación de multi- 
plicación de «números» de K por «vectores» de Y está definida como 
la multiplicación habitual de números enteros. Convendremos en 
indicar los números enteros que representan los vectores de Y con 
cifras gruesas, mientras que los números de K se indicarán con cifras 
corrientes. Puesto que para cualquier vector r3 es válida la fórmula 
m=m-1, 

nuestro módulo numérico Y resulta ser generado por el vector 1. 
Los vectores 2 y 3 son linealmente dependientes, ya que 


2.3+(—3)-2=0. 


Sin ES para cualquier a € K se tiene 4-32 y a-23%3, es 
decir, en Y ninguno de los vectores 2 y 3 se expresa linealmente en 
términos del otro. Las propiedades de los módulos sobre anillos 
arbitrarios son estudiadas sistemáticamente en la teoría de los mó- 
dulos, estrechamente ligada a la teoria de los números. Para nosotros, 
en cambio, tendrán interés solamente las propiedades de los espacios 
vectoriales y tocaremos la teoría de los módulos sobre anillos sólo 
cuando esto sea mecesario para la teoria de los espacios vectoriales. 


4.3. Isomorfismo. El concepto de espacio lineal tiene dos facetas 
esencialmente diferentes. En primer lugar, un espacio lineal es un 
conjunto de ciertas entes que se denominan vectores y, en segundo 
lugar, en un espacio lineal actúan las operaciones de adición y de 
multiplicación por número. Por esto, o bien podamos limitarnos a 
estudiar qué es lo que representan los vectores y cuáles son la na- 
turaleza y las propiedades de los mismos, o bien podemos tomar 
otro punto de vista y estudiar las propiedades de las operaciones 
indicadas independientemente de la naturaleza de los elementos con 
los cuales se efectúan estas operaciones. En lo sucesivo nos intere- 
sarán solamente las propiedades del segundo género. Por ello, dos 
espacios de la misma estructura respecto a las operaciones de adición 
y de multiplicación por número se considerará que tienen las mismas 
propiedades o que son isomorfos. Con más precisión el concepto de 
isomor fismo puede enunciarse det modo siguiente: 

Dos espacios lineales sobre un mismo cuer po de coeficientes se llaman 
isomorfos, si se puede establecer una correspondencia biyectiva entre 
sus elementos, tal que a la suma de vectores del primer espacio co- 
rresponda la suma de los vectores correspondientes del segundo espacio 
y al producto de un número por un vector del primer espacio co- 
rresponda el producto de este mismo número por el vector correspon- 
diente del segundo espacio. 

Toda correspondencia biyectiva que posee las propiedades indi- 
cadas se llama isomorfa o isomorfismo. Consideremos las propiedades 
elementales de los isomorfismos. 

6—1843 


82 Cap. 1!, Espacios lineales 


En una correspondencia isomorfa el vector nulo corresponde al 
vector nulo. En efecto, supongamos que en una aplicación isomoría 
de un espacio lineal * sobre otro espacio lineal *, el vector a de £ 
corresponde al vector a, de £,. Entonces, según la definición de 
un isomorfismo, el producto 0O.a debe corresponder al producto 0-a,, 
es decir, el vector nulo del primer espacio debe transformarse en el 
vector nulo del segundo espacio. 

En una aplicación isomorfa un sistema de generadores del primer 
espacio se transforma en un sistema de generadores del segundo espacio. 

Efectivamente, sean a,, 4, -.., a, unos generadores del primer 
espacio y sean b,, b,, ..., 6, los vectores que les corresponden en 
el segundo espacio. Tomemos en el segundo espacio un vector ar- 
bitrario b y consideremos el vector a del primer espacio que le cor- 
e nondS: or hipótesis, el vector a puede ser representado en la 
orma 


a=4,/4, + 0,0, +... + 0,0. 


Según la definición de una aplicación isomorfa, la suma a,2,+-...-+0,0, 
debe transformarse en la suma a,b, +... +45, y, por A 
el vector b debe coincidir con la suma a,b,+... +05b,, es decir, 
los vectores b,, ..., b, constituyen un sistema de generadores del 
segundo espacio. 

En un isomorfismo los vectores linealmente independientes se trans- 
forman en vectores linealmente independientes. 

En efecto, supongamos que los vectores linealmente independien- 


tes 2, %, ..., Ap del primer espacio se transforman en los vectores 
br. Eq, ..., Om del a espacio. Supongamos que entre los últimos 
existe una relación de tipo 


Bb, + B,b, +... +B,b, =0,. 


Según la definición de un isomorfismo, al primer miembro de 
esta igualdad corresponde en el primer espacio el vector f,a, + B,a, + 
+... +PBp20n y al vector nulo o, corresponde en el primer espacio 
el vector nulo o. Por consiguiente, 


Ba, +B,a, + ... + Bn =0. 


Puesto que los vectores a,, ..., 2, son linealmente independientes 
se tiene 
B =P, = o =P, =0, 
es decir, los vectores b,, ..., b,, son linealmente independientes. 


De las dos propiedades últimas se deduce directamente que en 
un isomorfismo una base de un espacio lineal se transforma de nuevo 
en una base de un espacio líneal y, por consiguiente, los espacios 
lineales isomorfos tienen la misma dimensión. 
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La afirmación recíproca es también válida: sí dos espacios lineales 
subre un mismo cuerpo de coeficientes tienen la misma dimensión, son 
isomorfos. 

Para la demostración tomemos una base cualquiera en cada uno 
de los espacios dados, por ejemplo, a;, 8,, ..., Aa Y Dj, dy, ..., by: 
Diremos que los vectores 


4=0,4, +00 +... +0 An 


b=BL+B0 +. +81, 


son correspondientes, si a, =P,, ..., %,=B,. Puesto que todo vector 
de un espacio se expresa linealmente en términos de una base de 
un modo único, nuestra correspondencia es biyectiva. Sean ahora 


a=a,a,+0,0,+... +0,2, 
b= ap +24. + Aba 


dos vectores correspondientes. Entonces se tiene 


y 


ad = 04,4, $ AA, +... + 00,l, 
y 

ab ea ua, urb +... + 000: 
Puesto que en estas descomposiciones coinciden los coeficientes res- 
pectivos, los vectores ac y ab serán correspondientes, es decir, en 
nuestra correspondencia el producto de un número por un vector se 
transforma en el producto del mismo número por el vector corres: 
pondiente. Análogamente se demuestra que la suma de vectores se 
transforma en la suma de vectores correspondientes. Por esto, la 
correspondencia construida es un isomorfismo, que es lo que se queria 
demostrar. 

Las propiedades de las correspondencias isomorfas que hemos 
enunciado muestran que fijado el cuerpo principal K todo espacio 
lineal queda determinado, salvo un isomoríismo, por su dimensión. 
Por esta razón, los espacios de filas de longitud n con elementos 
"de un cuerpo K, donde n=»=1, 2, ..., agotan, salvo isomorfismos, 
todos los espacios de dimensión finita sobre K. En particular, el 
espacio habitual de segmentos orientados es isomorfo al espacio de 
filas de longitud tres sobre el cuerpo de los números reales, el es- 
pacio de funciones definidas sobre un conjunto Wi, compuesto por s 
elementos, y con valores en un cuerpo K es isomorfo al espacio de 
filas de longitud s con elementos de K, etc. 


Para concluir hagamos una observación más. En el Algebra general desemn- 
peñan un papel dde el concepto de álgebra de signatura dada y el concepto 
de isomorfismo de álgebras de signatura determinada. En la definición que hernos 


f, ? 
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dado del concepto de módulo no se ha indicado, desde el punto de vista formal, 
la signatura del módulo, es decir, no se han señalado las operaciomes que se 
consideran como principales y respecto a las cuales se define el concepto de 
isomorlismo. Definiendo pe igual que para los espacios lineales) el concepto de 
isomorfismo de módulos, fijamos con ello el conjunto de las operaciones princi- 
pales, aunque de un modo implícito. indicando estas operaciones explicitamente, 
ohtenemos la siguiente definición de módulo unitario que sólo en la forma dificre 
de la definición del p. 4.1. 

Se llama módulo unitario sobre un anillo K con el elemento unidud ] un 
álgebra cuya signatura se compone del símbolo + de una operación binaria y 
de los simbolos — y F, (uE XK) de operaciones de una posición siempre que en 
este álgebra se cumplan las identidades 


My x+y=y+x, 

My x+ (UY 2) 32 (HN) Ez: 
Ma x+ YH 14) =x: 

Mi: FP, (Fg (a)) = Fag (a): 

My: F, (la+b)=F, (0) + Fa (0): 
Me: Foro la) =F, (a) +F3 (a); 
M»: F, (a) wa. 


Por consiguiente, la multiplicación de los elementos del conjunto principal 
(de los vectores) por cualquier elemento fijo a GX se considera aquí como unn 
operación principal independiente. Sí el anillo principal K es infinito, la signa- 
tura del módulo es también infinita. Cambiando el anillo X, cambiamos también 
la signatura de la clase de módulos. si 

Existe, en general, otra forma de incluir la teoría de módulos en la teoria 
general de álgebras. Para ello los módulos se consideran como álgebras compues- 
tas de dos conjuntos principales: el conjunto de los números y el conjunto de 
los vectores. La signatura consta ahora de las operaciones de adición de números, 
de paso al número opuesto, de adición de vectores, de paso al vector opuesto, 
de multiplicación de un número por un vector y de la operación O-aria que des- 
peja la unidad 1 (en total seis operaciones? Las identidades principales son en 
este caso las identidades que definen un anillo, las identidades que definen un 
grupo conmutativo y las identidades de 4” a 7” del p. 4.5. 

Este nuevo concepto de módulo es diferente del anterior. Todos los módulos 
tienen, en el sentido nuevo, una misma signatura (las seis operaciones indicadas) 
y por esto resulta posible preguntar si son o no isomorfos unos módulos defini- 
dos sobre distintos anillos. Estos isomorfismos nuevos suelen llamarse, en dife- 
rencia de los definidos anteriormente. antiisomorfismos. En este orden de ideas 
se definen también los antiautomorfismos y los antiendomorfismos y otros con- 
ceptos análogos. 


Ejemplos y problemas 


l. Demuéstrese que la dimensión del espacio de todos los polinomios en una 
variable de grado no mayor que n es igual a n+1. 

2. Los polinomios homogéneos en dos variables de grado n constituyen un 
espacio lineal de dimensión n+1. 

3, ¿Cuál es la dimensión del espacio de los polinomios homogéneqs en k 
variubles de grado n? 

4. Las matrices de m filas y de n columnas formadas por elementos de un 
cuerpo dado K constituyen un espacio lineal respecto a las operaciones usuales 
matriciales de adición y de multiplicación por número. Demuéstrese que las 
matrices en las que un elemento es igual a la unidad y todos los demás ele- 
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mentos son iguales a cero, constituyen una base de este espacio y que, por 
Dir dq apre la dimensión de este espacio es igual a mn. 

. Las matrices simétricas, asi como las matrices antisimétricas, de orden n 
formadas por elementos de un cuerpo K constituyen unos espacios lineales sobre X. 


Demuéstrese que las dimensiones de estos espacios son Íguales a nn ya 


2 , respectivamente. 


$ 5. Coordenadas 


5.1. Coordenadas de un vector. En el parágrafo anterior hemos 


considerado las propiedades generales elementales de los espacios 


lineales. Sin embargo, en las aplicaciones, además de conocer las 
propiedades generales, es importante saber definir los vectores en 
términos de números y poder reducir las operaciones vectoriales a 
operaciones con números. Este problema se resuelve introduciendo 
las coordenadas de un espacio vectorial. 

Toda base de un espacio lineal %, cuyos vectores se tornan en 
un orden determinado, se llamará base de coordenados o sistema de 
coordenadas de *. Por consiguiente, si 


0 A (1) 


es un sistema de coordenadas de *, estos mismos vectores, pero to- 
mados en otro orden, representarán otro sistema de coordenadas de 
2, Heros visto que todo vector a de * puede ser representado uní- 
vocamente en la forma siguiente: 


a=0,0,+04,+... +0,8,. (2) 


Los números 0,, ..., a, se llaman coordenadas del vector a en el 
sistema de coordenadas (1). La fila los lar ---, A,] compuesta por 
las coordenadas del vector a, tomadas en un orden adecuado, se 
llama fila de coordenadas y se indica por (a]. Por consiguiente, una 
vez escogido en el espacio un sistema de coordenadas determinado, 
a todo vector corresponde una fila de coordenadas y, viceversa, para 
toda fila de longitud n se obtiene con la fórmula (2) un vector de- 
terminado a, para el cual esta fila es su fila de coordenadas. 

Supongamos que [a,, ..., «,) y [P,. -.., P,] son las filas de 
coordenadas de los vectores a y 6, es decir, 


4 =0,0, + Ay, + E + QQ, 
y 

b=P,a,+PBa.+...+8B,0,. 
Es evidente que 


00 =(00,) 2, +(00,) 0, +... +(00,)a, 
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a+b=(a,+B)a,+(0,+P)a,+... +(a, +8.) 2,. 


Empleando las reglas de operaciones con filas, estas ¡gualdades pue- 
den ser representadas en la forma 

[aa] =e [a] y [a+b] = [a] + [6]. 
Pur consiguiente, la fila de coordenadas de una suma de vectores es 
igual a la suma de las filas de coordenadas de los sumandos y la fita 
de coordenadas del producto de un número por un vector es igual al 
producto de este número por la fila de coordenadas del vector. 

Este resultado puede ser interpretado de la forma siguiente. 
Sea £ un espacio lineal de dimensión n sobre un cuerpo K. Sea Y, 
el espacio de filas de longitud n formadas por elementos de K. 
Tomemos en 2 un sistema de coordenadas determinado y pongamos 
en correspondencia a todo vector de £ su fila de coordenadas. Nuestro 
resultado significa que esta correspondencia es un isomorfismo entre 
£ y 2,. En particular, de aquí se desprende que los vectores line- 
almente independientes tienen filas de coordenadas linealmente inde- 
pendientes y que toda relación de dependencia lineal entre los vectores 
dados tiene lugar también para las filas de coordenadas de los mismos. 

En un mismo espacio € existen diferentes sistemas de coorde- 
nadas. Por esto surge la pregunta: ¿cómo varían las coordenadas de 
un vector al cambiar un sistema de coordenadas por otro? Para re- 
solver este problema, tomemos en € dos sisternmas de coordenadas 


A, Ga ---, UG, Y G;, G, ...,(, cualesquiera. Puesto que los vectores 
a,. -... Q, constituyen una base de *, los vectores a; ...., a, deben 
expresarse linealmente en términos de a,, ..., a,. Sean 


y =7,0, +70, +... +T An; 
Ag == Y 10, 4 Tay Y ++ Tena» 


la == Tar?, + 1,30, + OS + Tun y» 


esta» expresiones. La matriz 


Ta Tm --- Tm 

T En Tas Tas ce. . Tan 

Ton Tar Los» Ton 
se llama matriz del cambio del sistema de coordenadas a,, ..., 4, 
por el sistema de coordenadas a;,..., 4. Tomemos un vector a 
cualquiera y sean [a,. ..., 2) y [«a;. .... en] sus filas de coor- 


denadas en los sistemas antiguo y nuevo de coordenadas. Es decir, 
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tenernos ax 2,4, + 9% 0.+... +0,4, 
v 
a=0,4 +a0+... +0,4,. 


Tomando en la segunda de estas igualdades en lugar de los vectores 
Gi, .-., 4, sus expresiones en términos de a,, ..., 4,, obtenemos 


Gr (0/T,, bo + HAT) 0, Fl TA. HT) lb 
es decir 
Ay == OT + + + Tn, 
Ay = AT + AT + e. . + OnTny» 


Ln =% Tin HdiTan +. + Ton 


Estas igualdades son precisamente las fórmulas de transformación 
de coordenadas que buscábamos. Observando que la expresión para ay: 


A =,T,¡+ AgTah -.- + OnTaj 


representa el producto de la fila de coordenadas [fa;, ..., a] por 
la ¡-ésima columna de la matriz 7, vemos que todo el sistema de 
las fórmulas de transformación de coordenadas puede ser represen- 
tado brevemente en la forma matricial: 


CA A A. a [e 


Hemos obtenido la siguiente regla: 

REGLA DE TRANSFORMACIÓN DE COORDENADAS. La fila de coordena- 
das antigua de un vector es igual a la nueva multiplicada por la 
matriz del cambio. 

Demostremos el siguiente lema que en muchas ocasiones resulta 
útil. 

LEMA. Sean Á y B dos matrices cuadradas de orden n formadas 
por elementos de un cuerpo K. Si para cualquier fila [E,, ..., E,] 
de elementos de K resulta 


[E --.. E, 4=(E,, -... En] B. (3) 

se tiene A=B. 
En efecto, sean «ay, los elementos de la matriz A y sean P;, 
los elementos de la matriz B(i, j=1, ..., n); entonces cualquiera 


que sea ¿ para E,=1 y E,=0 (i + j) de la igualdad (3) resulta que 
O =Bir (, kl, . ., 12), que es lo que se quería demostrar. 

Consideremos ahora en un espacio lineal Y de n dimensiones 
dos sistemas de coordenadas a,, ..., A, Y Qi, .... Ms. Podemos 
expresar o bien a;, ..., a, en términos de a,. ..., Q,: 


ay =T,0, +... 4 T170a. 
RR A A O (4) 


AA= 7510, +. - + Tantas 
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o bien, al contrario, a,, ..., a, en términos de a;, ..., Q,: 
4,=0 401 +... +0, An, 
A, =3 07101 +... + 0,7: 


La matriz TP, formada por los coeficientes T,, es la matriz del 


cambio del sistema a,, ..., a, por el sistema as, ..., a, y la 
matriz S, formada por los coeficientes a,,, es la matriz del combia 
recíproco del sistema a;, ..., ah por el sistema a,, ..., a, Sea 
[x)] la fila de coordenadas de un vector cualquiera x en el sistema 
de coordenadas 4,, ..., Q, y sea Le, la fita de coordenadas del 
vector x en el sistema a, ..., a, Considerando que 4,, ..., 0, es 
el sistema antiguo y aplicando la regla de transformación de coor- 
denadas. obtenemos 

Ex] = (x],7. (5) 
Al contrario, considerando que el sistema antiguo es a;, ..., 4, 
tendremos 

[x],=[x] S. 
Tomando aqui en lugar de (x] su expresión (5), obtenemos 

[x], = [x)], TS 
y de forma análoga hi Ll 

[x] = [x) ST. 


Aqui el vector x y, por consiguiente, sus filas de coordenadas [x], 
y [x] son arbitrarias. En virtud del lema, obtenemos entonces 


E=TS=ST y S=T-1. 


Es decir, la matriz de la transformación de coordenadas siern pre 
posee la inversa que es la matriz de la transformación recíproca 
de coordenadas. 

Nuestros razonamientos permiten aclarar un detalle relacionado 
con las matrices inversas que hemos dejado sin consideración en el 
p. 2.3. Según el p. 2.3, una matriz cuadrada S se llama inversa de 
la matriz T, si se cumplen dos igualdades: 


ST=E y TSE. 


Si S satisface sólo la primera o sólo Ja segunda de estas igualda- 
des, se dice que es inversa a la ¿izquierda y, respectivamente, ¿nuersa 
a ta derecha. 

TEOREMA Si una matriz cuadrada T formada por elementos de 
un cuerpo K posee la matriz inversa a la izquierda o a la derecha S, 
la matriz S es simplemente la inversa de T. 

Tomemos un espacio Y de n dimensiones con una base cualquiera 
Qs +. +., Ag. Calculemos según las fórmulas (4) los vectores az, ..., as. 
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Demostrernos que son linealmente independjentes. Sea 
A03+...+4,4,=0. 
Es obvio que esta relación equivale a la condición matricial 
[Mys ++.» A]-T=0. (6) 


Si T posee la matriz inversa a la derecha S, multiplicando a la 
derecha ambos miembros de la igualdad (6) por S y observando 
que TS=E, obtenemos [A,, ..., An]=0. Por consiguiente, los 
vectores as, ..., a, son linealmente independientes y el sistema 
Ai, -.., GA; puede ser considerado como un nuevo sistema de coor- 
denadas* de Y, con la particularidad de que la matriz 7 será la 
matriz del cambio. La matriz del cambio posee la matriz inversa 
T-", Multiplicando la relación TS=E a la izquierda por T-*, 
obtenemos S =T"*. Hemos demostrado que una matriz inversa a la 
derecha es simplemente la matriz inversa. Análogamente se demues- 
tra que una matriz inversa a la izquierda es también simplemente 
la inversa. 

De los razonamientos realizados se desprende, en particular, que 
toda matriz invertible de orden nr es una matriz del cambio de 
determinados sistemas de coordenadas. 


5.2. Rangos de matrices. Consideremos un espacio lineal $* de 
dimensión finita n sobre un cuerpo K. Tomemos en £ una base 
cualquiera a,, ..., a, a título del sistema de coordenadas y supon- 


gamos que los vectores x,, ..., X, fienen respectivaniente las si- 
guientes filas de coordenadas 


[x,] =[%,.5> ..., An). 


Sabemos ya que el número máximo de vectores linealmente inde- 
pendientes en el sistema x,, ..., x, €s igual al número máximo 
de filas linealmente independientes en el sistema [x,). a £] 
es decir, coincide con el número máximo de filas linealmen 
independientes de la matriz A. 

El número máximo de filas linealmente independientes de una 
matriz arbitraria A, formada po elementos de un cuerpo dado K, 
se llama rango de la matriz A, o, con más precisión, rango según 


e 


las filas. , 
De este modo, el número máximo de vectores linealmente inde- 
pendientes entre los vectores x,, ..., Xx, €s igual al rango de la 


matriz formada por las filas de coordenadas de estos vectores. 
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Volvamos a considerar una matriz arbitraria Á de m filas y de 
n columnas. Escojamos en A cualesquiera % filas y £ columnas. 
Los elementos de la matriz A, que se hallan en los cruces de estas 
filas y columnas, tomadas en su orden natural, forman una matriz 
cuadrada de orden A, que se llama menor de orden £ de la matriz A. 
Considerando todos los menores de primero, segundo, etc. órdenes, 
de la matriz A, podremos ver que una parte de los mismos serán 
matrices invertibles y otra parte, matrices no invertibles. El orden 
máximo de los menores invertibles de la matriz A se llama rango 
de la misma según los menores O rango de menores. 

Los menores de primer orden son los elementos de la matriz A. 
Puesto que la matriz A se toma sobre un cuerpo, el hecho de que 
un menor de primer orden no sea invertible significa simplemente 
que este menor está formado por el número cero. Luego, una 
matriz A no posee menores invertibles si, y sólo si, está compuesta 
de ceros. En este caso se dice que el rango de menores de la ma- 
triz A es igual a cero. Observemos que el rango según las filas de 
la matriz nula es también igual a cero, ya que un sistema de vectores 
nulos no posee subsistemas linealmente independientes. Pretendemos 
demostrar ahora que el rango según las filas de una matriz arbi- 
traria coincide con su rango de menores. Antes de obtener este resul- 
tado, consideremos las matrices cuadradas. 

TEOREMA 1 Para que una matriz cuadrada A= |] a; ll... formada 
por elementos de un cuerpo K, sea invertible es necesario y suficiente 
que sus filas sean linealmente independientes. 

Sea a, (i=l, ..., n) la ¿ésima fila de la matriz. Entonces 
toda relación de dependencia lineal 


4,0, +...+4,4,=0 (1) 
entre las filas de la matriz A puede ser representada en la forma 
[Ar ..., An]J:A=0. (2) 


Siendo la matriz A invertible y multiplicando ambos miembros 
de la igualdad (2) por A”*, obtenemos [A,, ..., 4,]=0 y con esto 
queda demostrado que las condiciones del teorema 1 son necesarias. 

Recíprocamente, supongamos que las filas 2 ..., 4, de la matriz 
A son linealmente independientes. Sea £ el espacio vectorial de 
pep a filas de longitud n formadas por elementos del cuerpo K. 

as filas 


e, =[0, 0, ..., 1) 
constituyen una base de £. Por otra parte, el espacio £ es de n 
dimensiones y, por hipótesis, los vectores a,, ..., a, son lineal- 
mente independientes. Luego, los vectores a,, ..., a, forman también 
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una base del espacio %, Considerando la base e,, ..., e, como el 
sistema de coordenadas inicial en Y y la base a,, ..., 4, como un 
nuevo sistema de coordenadas, vemos que Á es la matriz del cambio 
del primer sistema de coordenadas por el segundo y que, por con- 
siguiente (véase el p. 5.1), la matriz A es invertible. 

COROLARIO. El determinante de una matriz cuadrada, formada por 
elementos de un cuerpo conmutativo, es igual a cero sí, y sólo si, las 
filas de esta matriz son linealmente dependientes. 

Efectivamente, para matrices cuadradas, formadas por elementos 
de un cuerpo conmutativo, la invertibilidad equivale a la regularidad, 
es decir, a que el determinante de la matriz sea diferente de cero. 

Tomando ahora en consideración la observación hecha al princi- 
pio de este punto, vemos que un sistema de n vectores de un espa- 
cio vectorial de n dimensiones sobre un cuerpo conmutativo forma 
una base de este espacio si, y sólo si, es diferente de cero el deter- 
minante de la matriz formada por las filas de coordenadas de los 
vectores indicados. 

El teorema 1 y su corolario tratan de las filas de una matriz. 
Sin embargo, estas proposiciones son válidas también para las 
columnas,. siempre que la expresión «relación de dependencia lineal 
de columnas» sea interpretada como una relación de dependencia 
lineal respecto a la multiplicación a la derecha de las columnas 
por los elementos de K. Por ello, siempre que no se diga lo contrario, 
la multiplicación de filas por elementos de K significará la multi- 
plicación a la izquierda de las filas por los elementos, mientras 
que la multiplicación de columnas por elementos de K significará 
la multiplicación a la derecha. Está claro que este convenio sobra 
si K es un cuerpo conmutativo. Para el caso de cuerpos K no con- 
mutativos el convenio aceptado es de importancia. 

Es fácil comprobar que todos los razonamientos que hemos 
empleado para demostrar e) teorema 1 permanecen válidos si la 
palabra «fila» es sustituida en los mismos por la palabra «columna». 
Así obtenemos el resultado siguiente. 

TEOREMA la Para que una matriz cuadrada, formada por elemen- 
tos de un cuerpo, sea i¡nvertible es necesario y suficiente que sus 
columnas sean linealmente independientes. El determinante de una 
matriz cuadrada, formada por elementos de un cuerpo conmutativo, 
es igual a cero si, y sólo si, las columnas de la matriz son lineal- 
mente dependientes. 

Es evidente que si se consideran matrices sobre un cuerpo con- 
mutativo, el teorema la se obtiene del teorema 1 pasando simple- 
mente a la matriz transpuesta. 

TEOREMA 2. Sea A=|lu,, ||, una matriz cualquiera formada por 
elementos de un cuerpo K. Los rangos de la matriz A según las filas, 
las columnas y los menores no varían si A se somete a una de las 
transformaciones siguientes: 
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a) se cambian entre sí cualesquiera filas de la matriz A; 

b) se cambian entre sí cualesquiera columnas de la matriz A; 

c) se suman a los elementos de una de las filas de la matriz A 
los elementos correspondientes de otra fila cualquiera multiplicados a 
la izquierda por un factor arbitrario fijo 1€ K; 

d) se suman a los elementos de una de las columnas de la matriz A 
los elementos correspondientes de otra columna cualquiera muttiplica- 
dos a la derecha por un factor arbitrario A€ K. 

El rango de la matriz A según las filas es igual al número 
máximo de elementos linealmente independientes en el conjunto de 
sus filas 8,, ..., Gp. Al cambiar el orden de las filas de A sólo 
alteramos la numeración de las últimas, pero Jos conceptos de 
dependencia o independencia lineal de vectores no están relacionados 
con la numeración. Así mismo, está claro que el rango de la matriz Á 
según las filas no varía al cambiar sus columnas. En efecto, sean 
b,, ..., b, las filas de la matriz nueva obtenida después del cambio 
de columnas. Supongamos que entre las filas de la matriz A existía 
una relación de dependencia lineal 4,a,+... +42, =0; es evidente 
que las filas nuevas verificarán la relación análoga 1,0,+...+4AmD,y =0 
y que, viceversa, la última relación implicará la anterior. Lo mismo 
ocurrirá si a una columna cualquiera de la matriz A se agrega otra 
columna multiplicada a la derecha por A. Finalmente, el número 
máximo de filas linealmente independientes no cambiará si la ¿-ésima 
fila de la matriz A es sustituida por la fila a,+4a, ya que los 
vectores del sistema a,, ..., a¿ +20, ..., Ap .+»., A, Se expresan 
linealmente en términos de los vectores a,, ..., 4, y los vectores 
del último sistema se expresan linealmente en términos de los 
vectores del primer sistema. 

Hemos visto que el rango de la matriz A según las filas no 
varía en las transformaciones indicadas en el teorema. Razonamientos 
análogos demuestran que el rango de la matriz Á según las colum- 
nas no varía en las transformaciones a), b), c) y d). Pasemos ahora 
a demostrar que tampoco varía el rango de la matriz Á según los 
menores, lo cual requerirá una mayor atención. 

Supongamos que en la matriz A se cambian entre si cuales- 
quiera filas o columnas. En este caso los menores de la matriz 
nueva se obtienen de los menores de la matriz antigua mediante 
cambios de filas o columnas y sólo debernos comprobar que al 
cambiar filas o columnas en una matriz invertible de nuevo obte- 
nemos una matriz invertible. 

Supongamos, pues, que en una matriz cuadrada B=||B,,ll,, se 
han cambiado entre sí ta primera y la ¿-ésima filas. El cálculo 
directo deja constancia de que la matriz nueva puede ser represen- 
tada en la forma DB, donde 


D=E,, +En-+ ..>. +E¡-., ¡a PEn tE 141 + ... + Esr- 
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Aquí E;, es la matriz cuyo elemento de la ¿-ésima fila y /-ésima 
columna es la unidad, mientras que todos los dernás elementos 
suyos son ceros. Mediante cálculo directo podemos comprobar que 


DD=E y D-""=D. 


Por esto, si la matriz B tiene inversa, la matriz B”*D será la 

inversa de DB. Análogamente, la matriz BD se obtiene de B 

cambiando entre sí la primera y la ¿-ésima columnas. Si B 

> invertible, la matriz BD también tiene la inversa, a saber, 
—1 


Hemos demostrado que el rango de menores no varía al cambiar 
entre sí filas y columnas. Supongamos que el rango de menores de 
B es igual a r y que a la ¿-ésima fila de B se ha agregado la 
j-ésima fila multiplicada por A. Por hipótesis, la matriz B posee 
un menor invertible de orden r perteneciente a r filas y a r columnas 
determinadas. Para no complicar sin necesidad la notación, acep- 
temos que este menor pertenece a Jas r filas primeras y a las r 
columnas "primeras de la matriz B. Si la ¿-ésima fila que se altera 
no pertenece a las r primeras filas, el menor indicado de orden r 
continuará siendo un menor de la matriz nueva. Por esto el rango 
de la matriz nueva es >=r. Supongamos que la ¿-ésima fila es una - 
de las r primeras filas. Consideremos los elementos de las matrices 
nueva y antigua que se encuentran en las r primeras columnas, en 
las r primeras filas y en la j-ésima fila (j > r). Obtendremos las 
matrices 


B., B,, BP, P,, 3 
O E o E A 

B, B.. Br B,, 

LBa Br L Ba Br 


En virtud del teorema 1, las primeras r filas de la matr.z P son 
linealmente independientes y, por ello, el rango de P según las 
filas es igual a r. De acuerdo con lo demostrado, de aquí se deduce 
que el rango de la matriz Q según las filas es también igual a r. 
Las primera, ..., (¿—1)-ésima, (i+1)-ésima, ..., r-ésima filas de 
la matriz Q son desde luego linealmente independientes, ya que 
forman parte del sistema linealmente independiente de las r primeras 
filas de la matriz Q. Por esto, obien las r primeras filas de la matriz Q 
son linealmente independientes o bien la i¿-ésima fila se expresa 
linealmente en términos de las restantes y, por consiguiente, son 
linealmente independientes las restantes r filas de la matriz Q. En 
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otras palabras, uno de Jos menores 


Bn --- B, ly 

B. A | A 

.o. . . .. . .. . . +. . .0/. Pim, 1 . Br, 
Pt Pty 9 lBrera Bis. 
Ba Br Di cr 


Lon ++ Bro oy 


de la matriz Q está formado por filas linealmente independientes. 
En virtud del teorema 1, este menor es invertible y el rango de 
menores de la matriz Q es no menor de +. 

Hemos demostrado que la transformación de tipo c) no dismi- 
nuye el rango de menores de una matriz. Pero, si la matriz € se 
obtiene de la matriz A agregando a su ¿-ésima fila la j-ésima fila 
multiplicada por 2, ta matriz A s obtiene de C sumando a la 
i-ésima fila de la matriz C su /-+ésiria fila multiplicada por —A. 
En una y otra transiormación los rangos de menores no disminuyen y, 
por consiguiente, no varían. Resta considerar el caso de la trans- 
formación d); pero para ella la invariabilidad del rango de la 
matriz Á se demuestra de la misma forma que la invariabilidad 
en la transformación c). 

Del teorema 2 mediante razonamientos sencillos se deduce el 
siguiente teorema principal. 

TEOREMA 3 (SOBRE EL RANOO DB UNA MATRIZ). Para una matriz 
arbitraria A=|]a;y lin, formada por elementos de un cuerpo, el rango 
según las filas, el rango según las columnas y el rango según los 
menores coinciden. 

La proposición es evidente si todos los elementos de la matriz A 
son iguales a cero. Por esto, supondremos que A contiene un ele- 
mento «a;, diferente de cero. Cambiando entre sí la primera y la 
i-esima fílas y la primera y la j-ésima columnas de la matriz A, 
obtendremos una matriz B=||P,,]] en la que P,, =,,>0 y, ade- 
más, en virtud del teorema 2, los tres rangos de la matriz B serán 
iguales a los rangos correspondientes de la matriz A. Sumando 
ahora a la segunda, ..., m-ésima filas de la matriz B su primera 
fila multiplicada a la izquierda por —BuBi, .... — 
respectivamente, obtendremos una matriz de tipo 


Ba Pas e... Br 


-] 
mio 11 > 


hh . ... . + 


con la particularidad de que los tres rangos de la matriz C, serán 
los mismos que los de la matriz A. Si todos los y,, son iguales 
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a cero, no realizamos ninguna transformación más. En cambio, si 
Yi 7 0, (¡> 2, Ptl cambiamos entre sí la segunda y la ¡-ésima 
filas y la segunda y la j-ésima columnas de la matriz C,, obtenien- 
do así una matriz en la que el elemento y,, sea diferente de cero. 
Sumando entonces a la tercera, ..., m-ésima filas la segunda fila 
multiplicada por — Ya Y» ---+ —Yas Ya» respectivamente, obten- 
dremos una matriz de tipo 


3n (6, 195, JÁ 0). 


Los rangos de la matriz C, también coincidirán con los rangos 
correspondientes de la matriz A. Continuando este proceso, al cabo 
de un número de pasos no mayor que m, obtendremos una matriz 
de tipo 


Cl Pre +++ Par Bro rr + Bn? 
0 Pee «> Mar Barr > Pen 


A IS A (Mis --- By, 3720). 
0.500 ... 00 0 
lo 0 00 o | 


cuyos rangos coincidirán también con los rangos correspondientes 
de la matriz A. Sin embargo, de la forma de la matriz C, se de- 
duce directamente que los tres rangos de esta matriz son iguales 
a un mismo número r. Por esto, los tres rangos de la matriz A 
también tienen un mismo valor +. 

En el p. 2.3 se ha demostrado que una matriz cuadrada con 
elementos de un cuerpo conmutativo es invertible si, y sólo si, 
tiene el determinante diferente de cero. Por esto, para matrices 
sobre un cuerpo conmutativo el teorema 3 se puede enunciar del 
modo siguiente: 

TEOREMA 34. En toda matriz con elementos de un cuerpo conmuta- 
tivo el número máximo de filas linealmente independientes es igual 
al número máximo de columnas linealmente independientes e igual 
al orden máximo de sus menores de determinante diferente de cero. 

La determinación práctica del rango de una matriz se realiza 
generalmente aplicando el método indicado en la demostración del 
teorema 3 o alguna de sus modificaciones convenientes. 
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Con frecuencia resultan útiles las dos observaciones siguientes 
que se deducen directamente del teorema 3. 


TEOREMA 4. Cualesquiera que sean dos matrices A=||a;llan Y 
B=|| Bj lor con elementos de un cuerpo arbitrario el rango del pro- 
ducto AB es no mayor que el rango de la matriz A y no mayor 
que el rango de la matriz B. 

Efectivamente, de la definición del producto se ve que las filas 
de la matriz AB son combinaciones lineales de las filas de la 
matriz B y, por consiguiente, el número máximo de filas linealmente 
independientes de la matriz AB no puede pasar del número máximo 
de filas linealmente independientes de la matriz B. Análogamente, 
las columnas de la matriz AB son combinaciones lineales de las 
columnas de la matriz Á y, por consiguiente, el rango de la mat- 
riz AB ún las columnas es no mayor que el rango según las 
columnas de la matriz 4. 

TEOREMAS Si los elementos de la matriz Á pertenecen a un 
cuerpo conmutativo, su rango coincide con el rango de la matriz 
transpuesta A”. 

Todos los menores de la matriz A” se obtienen por transposición 
de los menores de la matriz A. Puesto que los elementos de los 
menores se toman en un cuerpo conmutativo, de la transposición 
de un menor invertible resulta un menor invertible y, por consi- 
guiente, el rango (según los menores) de la matriz A” coincide con 
el rango (según los menores) de la matriz A. 

En los o de la pág. 101 se da un ejemplo de una matriz 
invertible, formada por elementos de un cuerpo no conmutativo, 
cuya matriz transpuesta no es invertible. 


5.3. Sistemas generales de ecuaciones lineales. Consideremos un 
cuerpo K y un sistema arbitrario de ecuaciones de tipo 


15, + 01:57 +... + Ann = Br 
Ay15, A A (1) 


CarEi FA mberh a + arión Ba» 


donde «a,, y f, son elementos dados de K y Es, Ez, --., É, Son 
incógnitas, cuyo número n puede ser mayor, menor o igual al 
número m de ecuaciones. En el p. 2.4 ha sido expuesto uno de 
los algoritmos de la resolución de estos sistemas, el método de 
eliminación de incógnitas. El teorema sobre el rango de una ma- 
triz, demostrado en el punto anterior, ofrece un acceso diferente 
al estudio de los sistemas de ecuaciones lineales. 

Los coeficientes «,, y los términos independientes f, de las 
ecuaciones (1) se pueden disponer de un modo natural formando 


$ 5, Coordenadas 97 


dos matrices. 


A CA e Gin P, 

Ay gg -.. Ag A 
Á= n y B= »n Pa 

Art Am 20 e Can LEm An: e. Uma Bn 


llamadas matriz principal y matriz ampliada del sistema (1). A toda 
ecuación del sistema (1) corresponde una fila determinada en las 
matrices A y B. El intercambio de ecuaciones en el sistema (1) 
lleva al intercambio correspondiente de filas en las matrices A y B 
y la modificación de la numeración de las incógnitas lleva al in- 
tercambio de columnas en las matrices indicadas. 

Se dice que la ¿-ésima ecuación del sistema (1) depende lineal- 


mente de las ¿,-ésima, ..., 1s-ésima ecuaciones de este sistema, 
si la f-ésima fila de la matriz B es una combinación lineal de sus 
¿, ésima, ..., t,-ésima filas. Puesto que el cuerpo XK no se supone 


conmutativo, las filas de las matrices se multiplican por elementos 
de K siempre a la izquierda, mientras que las columnas, a la 
derecha (véase el p. 5.2). 
Se llama solución del sistema de ecuaciones (1) una sucesión 
%, ..., El de elementos del cuerpo K que al ser introducidos en las 
ecuaciones (1) en lugar de las letras E,, ..., E, hacen válidas todas 
las igualdades. Si disponemos los elementos E,, ..., E, en una 
columna [E,, ..., ExJ' =x, el sistema (1) puede ser representado 
en la forma matricial 
A.x=b0b, (2) 


donde b es la columma [B,, ..., f,)' de los términos independientes. 

A) Si la iésima fila de la matriz B es una combinación lineal 
de sus restantes filas, entonces suprimiendo en el sistema (1) la 
i-ésima ecuación obtendremos un sistema reducido de ecuaciones que 
tiene el mismo conjunto de soluciones que el sistema (1). 

Está claro que toda solución del sistema (1) es también una solución 
del sistema reducido. Recíprocamente, supongamos que la ¿-ésima 
fila de la matriz B es igual a la suma de las ¿,-ésima,..., [,-ésima 
filas multiplicadas a la izquierda, respectivamente, por los elemen- 
tos Aj, ..., A, de K(i3ti,, ..., ds) y supongamos que los valores 
9 ..., El satisfacen las í,-ésima, ..., ¿,-ésima ecuaciones de (1). 
Entonces, multiplicando estas ecuaciones a la izquierda por A,, ...As, 
respectivamente, y sumándolas término por término, obtendremos 
la ¿-ésima ecuación. 

B) Si el rango (según las filas) de la matriz B es igual a r, 
el sistema de ecuaciones (1) contiene un subsistema de r ecuaciones 
linealmente independientes que posee el mismo conjunto de soluciones 
que el sistema (1). 


7--1843 
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Puesto que el rango de la matriz B es igual a r, la matriz B 
posee r filas linealmente independientes y todas sus filas restantes 
se expresan linealmente en términos de éstas. Tomando las ecuacio- 
nes que corresponden a las r filas linealmente independientes se- 
ñaladas, obtendremos el subsistema deseado. 

C) Si el sistema de ecuaciones (1) tiene una solución ES, ..., €%, 
el rango de ta matriz ampliada B coincide con el rango de la matriz 
principal A. 

Si las igualdades (1) son válidas para ÉE%, ..., E%, esto demuestra 
que la última columna de Ja matriz B es igual a la suma de sus 

rimera, ..., n-ésima columnas multiplicadas a la derecha por 
% -.., Ef, respectivamente. Por esto, el número máximo de columnas 
linealmente independientes de la matriz B es igual al número má- 
ximo de columnas linealmente independientes de la matriz Á, es 
decir, el rango según las columnas de la matriz B es igual al rango 
según las columnas de la matriz A. Las palabras «según las columnas» 
pueden ser omitidas, ya que en el p. 5.2 se ha demostrado que el 
rango según las columnas coincide con el rango según las filas. 

De las proposiciones B) y C) resulta fácilmente el siguiente 
teorema principal. 

TEOREMA DE KRONECKER—CAPELLI.*) Para que el sistema de ecua- 
ciones (1) tenga solución, es necesario y suficiente que el rango de 
la matriz ampliada sea igual ai rango de la matriz principal de 
este sistema. Si los rangos de las matrices principal y ampliada 
coinciden con el número de incógnitas, el sistema tiene una solución 
única. Sí el rango r de las matrices principal y ampliada es inferior 
al número n de incógnitas, el sistema (1) tiene más de una solución 
y es equivalente a un sistema de tipo 


E, => Yu b, + “Y, alar E Vio | 


(3) 


donde (i,, ..., lo dí ...» In=,) es una permutación adecuada de 
fos números 1, 2, ..., n. 

En otras palabras, en el último caso entre las incógnitas E,, ..., E, 
se pueden escoger n —r incógnitas Ey, -..., Ey, _ , llamadas libres, 
y dándoles valores arbitrarios de K se pueden encontrar para las 
restantes incógnitas unos valores únicos que satisfagan el sistema (1). 

La necesidad de las condiciones se deduce de la proposición C). 
Supongamos, por esto, que los rangos de las matrices A y B coin- 
ciden y son iguales a r. La matriz A contiene un total de r colum- 
nas, de modo que r<n. Por hipótesis, la matriz A posee un 


1) En algunos libros españoles este teorema se conoce como el teorema de 
Rouché — Frobenjus. (N. del Tr.) 
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menor invertible M de orden r (véase el p. 5.2) que pertenece 
a las R,_ésima, ..., R,-ésima filas y a las (,-ésima, ..., f,-ésima 
columnas de la matriz A. De aquí se deduce que la k,-ésima, ..., 
la k,-ésima filas de la matriz B son linealmente independientes, 
mientras que sus filas restantes son combinaciones lineales de las 
filas señaladas. Por esto, dejando solamente la k,-ésima, ..., la 
k,-ésima ecuaciones del sistema (1) y suprimiendo todas las demás 
ecuaciones, obtendremos un sistema reducido que tendrá las mismas 
soluciones que el sistema (1). Dejando ahora en los primeros miem- 
bros de cada una de las ecuaciones del sistema reducido los térmi.- 
nos que contienen las incógnitas E, ..., Es, y pasando al otro 
miembro todos los demás términos, llevaremos el sistema reducido 
a la forma 


Es, DE E 
Mo. l=! 1, (4) 
LJ lo! 
donde 
Cs =— Uña, 1151, — + ++ — tao Imola FB (s=1, +.., 1). 


Por hipótesis, el menor M es una matriz invertible. Multiplicando 
ambos miembros de la igualdad (4) a la izquierda por M”?, obte- 
nemos 


51, C, 
=M”! 
Es, 7 
Realizando la multiplicación en el segundo miembro, llegamos al 
sistema de tipo (3). El teorema queda demostrado. 

El sistema de ecuaciones (1) suele llamarse determinado, inde- 
terminado y contradictorio según tenga, respectivamente, solución 
única, más de una solución y no tenga solución. Notemos que de 
acuerdo a esta terminología un sistema, que no es determinado, es 
o bien indeterminado o bien contradictorio. 

COROLARIO 1. Si el número de ecuaciones del sistema (1) es inferior 
al número de incógnitas, el sistema (1) es o bien indeterminado o bien 
contradictorio. 

COROLARIO 2. Un sistema de n ecuaciones lineales con n incógnitas 
es delerminado si, y sólo si, la matriz principal de este sistema es 
invertible. 


Ambos corolarios se desprenden directamente del teorema de 
Kronecker —Capelti. 


7 a 
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Hemos considerado el sistema de ecuaciones lineales (1) en el 
que los coeficientes aparecen a la izquierda de las incógnitas. ¿Qué 
puede decirse acerca del sistema de ecuaciones 


yr Es E e > > 4 Er = Pas 


A A (5) 
EG ym Y Esas + > + E En = Bo 


en el que los coeficientes figuran a la derecha de las incógnitas? 
Este sistema puede ser representado en la forma matricial 


[Ez A En): A= [B,, 2... Br]. 


donde A=|]a;,l] es la matriz de los coeficientes de las incógnitas 
en el sistema (5). Prestemos atención a que en la matriz A los 
coeficientes de la ¿-ésima ecuación forman la ¡-ésima columna y no 
la ¿-ésima fila como sucedía anteriormente. Todos los razonamien- 
tos, que hemos realizado al demostrar el teorema de Kronecker — 
Capelli, siguen siendo válidos también para el sistema (5), siempre 
que se cambien entre sí en ellos las palabras «columna» «y «fila» y 
siempre que por la matriz ampliada del sistema (5) se comprenda 


la matriz 
A Ar 
E es Lo. j 
B, Bm a) 


Por consiguiente, para que el sistema (5) sea compatible es ne- 
cesario y suficiente que el rango de la matriz B coincida con el 
rango de la matriz A. Si los rangos de las matrices A y B coin- 
ciden y son iguales al número de incógnitas, el sistema (5) tiene 
solución única. Si los rangos de las matrices A y B coinciden y son 
iguales a un número r menor que el número n de las incógnitas, 
entre las incógnitas podrán encontrarse n-—r incógnitas libres 
El» «. 1) Elmo. y todas las demás incógnitas E;,, ..., El, se expre- 
sarán en términos de éstas por fórmulas de tipo 


E.L=E Vs TE ElnorVn=r, s Y Ys (sl, .... 1). 


Está claro que toda diferencia entre los sistemas (1) y (5) desa- 
parece, si se consideran ecuaciones lineales sobre un cuerpo con- 
mutativo. En el caso de cuerpos no conmutativos K (por ejemplo, 
para los cuaternios (véase el p. 1.5)), además de los sistemas stan- 
dard de tipo (1) y (5) se consideran también ecuaciones de tipo 
«mixto» como es, por ejemplo, la ecuación aE—¿a =0. Sin embargo, 
los problemas relacionados con la resolución de estas ecuaciones 
tienen un carácter específico y se salen de los márgenes del Algebra 
lineal propiamente dicha. 
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il. En el espacio de fitas de longitud tres sobre el cuerpo de los números 
racionales se toma un sistema de coordenadas formado por las filas (1, 3, 5), 
[6, 3, 2] y (3, 1, 0]. ¿Qué filas de coordenadas tienen en este sistema los vec- 
tores 13, 7, 1], (0, 0, 1], [o 3, 5] y [!, 1, 1)? 

2. El espacio £ está formado por los pollnomios en A de grado no mayor 
que n. Demuéstrese que Jos polinomios 1, A—1, (A— 1), ..., (A—-1)" consti- 
tuyen una base de L, Hállense en esta base las filas de coordenadas de los po 
linomios 2=314 4-43 y An, 

3. En el plano se toma un sistema de coordenadas, compuesto pur dos vec- 
tores mutuamente perpendiculares de a l, y después se realiza una trans- 

0 


formación de coordenadas de matriz E ]. ¿Qué condiciones deben verificar 


los números a, P, y y Ó para que los nuevos vectores coordenados sean mutua- 
mente ES y de longitud 1? 
4. Hállense los rangos de las matrices 


10 2 5 27 11117 IFA J 1 1 1 
=21 12 3 x y zu cs E 1 
2171794 || xg2R0us Y] 1 1I1+4A 1 | 
C 1315 41 55 Lx y 25 sue Lt! l1. 1. 1% 


5. Demuéstrese que en el cuerpo de los cuaternios K (p.1.4) el sistema de 
ecuaciones lineales «a la derecha» 


ys + Er = l, ) 
RE, —Ez=1 


tiene solución única, mientras que el sistema de ecuaciones «a la izquierda» 


E +Ey] == 1,1 


no tiene soluciones. Tenemos así un ejemplo de una matriz invertible sobre un 
cuerpo, cuya matriz transpuesta no es Invertible. 

6. Hasta el momento entendíamos la independencia lineal de filas como la 
independencia lineal respecto a la multiplicación de filas a la Izquierda por los 
elementos del cuerpo K y la independencia lineal de las columnas como la inde- 

ndencla respecto a Ja multiplicación de columnas a la derecha po los elemen- 
os del cuerpo. Esto está relacionado con la regla inicial de multiplicación de 
las matrices: las filas de le primera se multiptican por las columnas de la se- 
unda. Por supuesto, la teoria no camblará sí las matrices se multiplican por 
a regla «izquierda»: las columnas de la primera se multiplican por las filas de 
la segunda. Pero en este caso, habrá que considerar la dependencia lineal de las 
filas respecto a ta multiplicación a la derecha por los elementos de K y la 
dependencia lineal de las columnas respecto a la multiplicación a la izquierda 
por los elementos de K. Como resultado, obtendremos los rangos de una matriz 
según las filas a la derecha y según las columnas a la izquierda. Ambos ran 
coincidirán, pero en el caso general serán diferentes de los rangos corrientes 
según las filas (a la izquierda) y según las columnas (a la derecha). Como 
ejemplo puede servir la matriz de cuaternios 


to] 
la 13 
del Naco 5, en la que el rango a la Izquierda según las filas es igual,a 2, 
mientras que el rango a la derecha según las filas es Igual a 1. 


7. Sea A una matriz cuadrada invertible de orden n y sean B E, C matrices 
arbitrarias cempuestas, respectivamente, por a fllas y n columnas. En estas con- 
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diciones, se tiene 
rango (A B) ua rango B, 
rango (CA) =rango C. 


8. Dése un ejemplo de matrices cuadradas A y B de un mismo orden 2, 
para las cuales se tenga rango (AB) 7 rango (BA). 

a Demuéstrese que para cualesquiera matrices cuadradas A y B de orden 
n se tlene 


rango (AB) = rango Á + rango B—n. 


$ 6. Subespacios lineales 


6.1. Intersección y suma de subespacios. Un conjunto no vacio 
NM de vectores de un espacio lineal Y se llama subespacio lineal de 
este espacio, si se cumplen las dos condiciones siguientes : 

19 sí A contiene un vector a, también contiene todos los múltiplos 
Aa, donde % es un número del cuerpo de coeficientes, 

Al si A contiene unos vectores a y b, también contiene su suma 
a+b. 

Está claro que armbas condiciones equivalen a la siguiente: si Y 
contiene unos vectores a y b, también contiene cualquier combinación 
lineal Ma+pyb de los mismos. 

De estas definiciones se desprende que todo subespacio lineal 2 
contiene el vector nulo y todas las combinaciones lineales de cuales- 
quiera vectores suyos. 


En el p. 4.3 se ha señalado que todo espacio lineal sobre un cuerpo K es 
un álgebra en la que las operaciones principales son: la adición de vectores, la 
inversión de vectores y la multiplicación de los vectores (a la qiero] por 
elementos de K. Puesto que la inversión de un vector equivale a su multipli- 
cación por el elemento —1 de K, das condiciones 1” y 2” significan simplemente 
que los subespacios lineales del espacio Y son subálgebras del álgebra R. 


El conjunto compuesto solamente del vector nulo posee las pro- 
piedades 1% y 2 y, por consiguiente, es un subespacio lineal de 2. 
Este subespacio se llama subespacio nulo. Por otro lado, el propio 
espacio Y puede ser considerado como un subespacio lineal de sí 
mismo. El subespacio nulo y * suelen llamarse subespacios trivía- 
les del espacio **. Todos los demás subespacios se denominan no 
triviales O propios. 

El método más sencillo de obtener subespacios lineales consiste 
en lo siguiente. En el espacio lineal dado * se toman unos vecto- 
res arbitrarios a,, 4y, ..., Q, y se consideran todas las combina- 
ciones lineales d los mismos 


10, + Ag H... + Anl > 
Sea Y el conjunto de estas combinaciones. Puesto que la suma de 
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combinaciones lineales de a,, ..., 4, y el producto de una combi- 
nación linea) por un número son combinaciones lineales de a,, ..., Qn, 
tenemos que Y es un subespacio lineal. Los vectores 2,, ..., QA, 


son los generadores de este subespacio. Suprimiendo aquellos qu 
dependen linealmente de los anteriores, obtendremos un sistema 
linealmente independiente de generadores del subespacio Y, es de- 
cir, una base de 9. Pero el número de vectores de una base coin- 
cide con la dimensión del espacio y, por ello, la dimensión del 
subespacio YU es igual al número máximo de vectores linealmente inde- 
pendientes que contiene el sistema a,, ..., An. A veces se dice que 
el subespacio YA es el subespacio tendido sobre los vectores a,, ..., jp. 
Por consiguiente, la dimensión del subespacio tendido sobre el 
sistema de vectores 4,, ..., 4, es igual al número máximo de vec- 
tores linealmente independientes que contiene este sistema. 

El método de tender los subespacios sobre un sistema de vecto- 
res dado es general: todo subespacio lineal Á de un espacio lineal Y 
es el subespacio tendido sobre su base. 

Como que el número de vectores linealmente independientes de 
€ no puede superar la dimensión de %, de aquí se ve que la di- 
mensión de un subespacio lineal no puede superar la dimensión del 
espacio que lo envuelve. Es más, si la dimensión del espacio lineal 
Y es igual a la dimensión del subespacio Y, toda base de A será 
también una base de *, Por esto, todo vector de Y se expresará 
linealmente en términos de una base del subespacio Al, es decir, 
9 coincidirá con %. Por consiguiente, la dimensión de todo subes- 
pacio lineal propio es inferior a la dimensión del espacio que lo 
envuel ve. 

A título de ejemplo consideremos el espacio corriente R, formado 
por los segmentos orientados que parten de un punto O. La dimen- 
sión del espacio R es igual a tres y, por esto, los subespacios pro- 
pios pueden ser de dimensión uno o dos. Los subespacios de dimen- 
sión uno deben ser tendidos sobre un vector no nulo a, es decir, 
deben ser el conjunto de los multiplos wa del segmento a. Pero 
todos los segmentos de tipo «a se hallan sobre la recta que con- 
tiene al vector a. Por consiguiente, los subespacios de Ñ de dimen- 
sión una son las rectas que pasan por el punto O. 

Los subespacios de dos dimensiones deben ser tendidos sobre 
dos vectores linealmente independientes, es decir, sobre dos vecto- 
res a y b que no pertenecen a una misma recta. Sea A el plano 
que pasa por los vectores a y b. Entonces, todas las combinaciones 
lineales «a+ Bb pertenecerán al plano Y y, por otro lado, todo 
vector perteneciente a A será una combinación lineal de los vec- 
tores a y b. Por consiguiente, el subespacio tendido sobre los vec- 
tores a y b será el conjunto de vectores pertenecientes al plano A. 
Luego, los subespacios de dos dimensiones del espacio N son los planos 
que pasan por el punto O. 
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Los espacios de dimensión mayor que tres no admiten una inter- 
pretación geométrica tan clara. Sin embargo, a ellos también se 
aplica la terminología geométrica llamando rectas a los subespacios 
lineales de una dimensión, planos a los subespacios de dos dimen- 
siones y planos de R dimensiones a los subespacios de dimensión k, 
para R>3. Los subespacios lineales de dimensión menor en 1 que 
ia dimensión del espacio llevan el nombre especial de hiper planos. 

Con los subespacios de un espacio lineal dado se pueden efec- 
tuar determinadas operaciones; las más importantes de éstas son la 
adición y la intersección. Se llama intersección de los subespacios 
A, BD, ... de un espacio * el conjunto HB de los vectores que per- 
tenecen simultáneamente a todos estos espacios. La operación de 
inlersección se indica por el símbolo N, de modo que 


P=ANBN... 


La intersección de cualquier número de subespacios lineales de un 
espacio % es un subespacio lineal de este espacio. 

En efecto, el vector nulo pertenece a cada uno de los subespa- 
cios dados A, BD, ... Por esto, pertenece también a la intersección 
WM de los mismos que es, por consiguiente, un conjunto no vacio. 
Por otro lado, si unos vectores a y b pertenecen a la intersección %Y, 
estos vectores, y con ellos cualquier combinación lineal aa + Bb de 
los mismos, pertenecerán a cada uno de los subespacios Y, Y, ... 
Por consiguiente, aa+ Bb está contenido en P, es decir, B es un 
subespacio lineal. 

Se llama suma de un número finito de subespacios lineales A,, 
A., ..., A, del espacio Y el conjunto de vectores que puedén ser 
representados en la forma 


a=a+4+...+4,, (1) 


donde a, es un vector de Y, (i=1, ..., s). La operación de adi- 
ción de subespacios se indica por el símbolo +. 

La suma de un número finito de subespacios lineales de un espa- 
cio Y es también un subespacio lineal; contiene todos los vectores de 
los subespacios dados, ast como todas sus combinaciones lineales. 

En efecto, sean Y,, ..., A, los subespacios lineales dados y 
sea A=A, +... +A,. Si a y b son unos vectores de Y, ello sig- 
nifica que pueden ser representados en la forma 


a=4,+4+... +4, y b=b,+0,+...+0,, 


donde a; y b, pertenecen a YA, (t=1, ..., s). Pero, en este caso, 
para cualesquiera a y P de K la expresión 


aa + Bb = (aa, + Bb,) 4 (a0, + Bb) +... + (aa, + Bb,) 


es la descomposición en la forma (1) del vector «a+ Bb, ya que la 
suma aa,+ $b, pertenece a A,. Por consiguiente, aaQ+fPb pertenece 
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a A y A es un subespacio lineal. Tomando ahora en (1) a,=0 
para ¡X<1, vemos que a, estará contenido en YA, es decir, A 'con- 
tiene todos los vectores de Y,. 

Indiquemos, finalmente, sin demostración las propiedades siguien- 
tes de la suma de subespacios, que se desprenden directamente 
de su definición: 

1? A+ BD 49; 

2 + (B +6) = (A 4D) +6; 

3” sí A está contenido en un subespacio B, se tiene A+ B=D. 

Considerando la suma de dos subespacios lineales arbitrarios Y 
y B, podremos ver fácilmente que su dimensión depende no sólo 
de la dimensión de los subespacios A y VB, sino también de cuán 
grande es la parte común de los mismos. El valor exacto de la 
dimensión de la suma se determina por el teorema siguiente: 

TEOREMA. La dimensión de la suma de dos subespacios lineales de 
un espacio Y es igual a la suma de las dimensiones de estos subes- 
pacios menos la dimensión de su intersección . 

Sean A y Y los subespacios dados y sean r, y r, sus dimensio- 
nes respectivas. Sea m la dimensión de la intersección (E de estos 
subespacios. Tomemos en (É una base cualquiera c,, C,, ..., Cp. 
Los vectores C,, Cy, ..., €, son linealmente independientes y per- 
tenecen a A. Por esto, en Y se pueden encontrar unos vectores a,, 
Gp ..., Ay, tales, que el sistema a,, G,, ..., Qgo Cj) --., Cp Sea 
una base de 9[ (véase el p. 4.2). Por esta misma razón, en el su- 
bespacio Y existen vectores b,, by, ..., b, tales, que junto a los vec- 
tores C,, Ca, ..., C. constituyen una base de B, Puesto que el nú- 
mero de vectores de una base coincide con la dimensión del espa- 
cio, entre los números £ y p y las dimensiones de los subespacios 
A y 8 existen las relaciones 


r,=k+4m y r,=p+m. 
Si demostramos que el sistema 
As» a... Gps Cr -... Cm» b,. ro.» b, (2) 


es una base del espacio A+ Y, el teorema 1 quedará demostrado, 
ya que la dimensión del espacio A+ será igual a 


REm+p=r, +51 —m. 
Todo vector a de YA se expresa linealmente en términos del 
sistema Gi, ..., Gp €; ---» Cm Que constituye una base de Y y, 


por esto, se expresa también en términos del sistema (2). Análoga- 
mente, todo vector b de Y también se expresa linealmente en tér- 
minos de (2). Pero en este caso la suma a-+b, es decir, cualquier 
vector de A -+ Y, se expresará linealmente en términos de (2). Resta 
demostrar que el sistema (2) es linealmente independiente. 
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Sea 
LAA HOME NCAA Ya FP HB =0 (3) 
una relación de dependencia lineal entre estos vectores. Pongamos 
b=Bpb, +... +B,b,- 
El vector b se expresa linealmente en términos de los vectores 5b,, 
. »»» b, contenidos en el espacio B; luego, b pertenece a B. Por 
otro lado de (3) se desprende que 
b= —0,0,—+.. —0 a — YE +--—Ymla» (4) 


Puesto que Q,, ..., Gp Cp --.» Ep están contenidos en Y, de aquí 
se deduce que b también pertenece a A. Por consiguiente, b figura 
en la intersección de los espacios A y B, es decir, la expresión (4) 
del vector b en términos de la base de A no contiene términos con 
Qu -«-., Ag en otras palabras, 


4a,4=0ue4=>.. . = Aa =0. 


Tomando estos valores en (3), obtenemos 


E A A 


Pero el sistema €,. ..., Ca b,, ..., b, es una base de D y, por 
consiguiente, es linealmente independiente, de modo que 
Y=...=Y4=P =...=fP,=0. 


Hemos demostrado que el sistema (2) es linealmente independiente. 

Del teorema demostrado se puede deducir una desigualdad que 
ofrece el valor mínimo de la dimensión de la intersección de unos 
subespacios. Considerernmos unos subespacios lineales Y y B de 2 y 
sean f, y r, las dimensiones de estos subespacios, n la dimensión 
de % y m la dimensión de la intersección AMY. En virtud del teo- 
rema, la dimensión de la suma A -+B es igual a r,+r,—m. Pero 
la dimensión de la suma A+ B es no mayor que la dimensión del 
espacio £. Por consiguiente, 7, +r,—m<X<n, de donde se tiene 
m=>r,+r,—n. Es decir, la dimensión de la intersección de dos sub- 
espacios lineales del espacio L no puede ser menor que el exceso de 
la suma de las dimensiones de estos subespacios respecto a la dimen. 
sión del espacio *. 

Por ejemplo, la intersección de dos planos del espacio 
de tres dimensiones contiene siempre una recta, la intersección de 
un subespacio de dos dimensiones con un subespacio de tres dimen- 
siones en un espacio de cuatro dimensiones contiene una recta, la 
intersección de dos subespacios de tres dimensiones de un espacio 
de cuatro dimensiones contiene un plano, etc. 
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6.2. Sumas directas. Según la definición, todo vector a que per- 
tenece a la suma de subespacios lineales 


AA, + UA... +4, 
puede ser representado en la forma 
a=0,+4,+... +4, (4,E€EA,, i=1, ..., s). (1) 
Sin embargo, esta representación no será, en general, unívoca. Si 


todo vector a de A admite sólo una representación de tipo (1), es 
decir, si de las igualdades (1) y de 


a=a+0+...+0, (€ A,, lual, ..., $) (2) 


se deduce que 4,=4;, ..., 44=4;, la suma se llama suma directa 
y se indica 
YAA +4A,+... +9. 


Las sumas directas poseen numerosas propiedades específicas, 
algunas de las cuales serán ahora consideradas. Ante todo observe- 
mos que en lugar de exigir que cualquier vector de la suma posee 
un desarrollo unívoco se puede exigir que el desarrollo unívoco: 
exista sólo. para el vector nulo: si el vector nulo de la suma U=YAU,+ 
+A,+... +2, admite un desarrollo único de tipo (1), es decir, st 


a,+4+...+0,=0 (a,E4A,, i=1, ..., $) 
implica que a,=4,=... =4,=0, la suma es directa. 
Para la demostración tomemos un vector cualquiera a de la su- 


ma y supongamos que admite dos desarrollos: (1) y (2). Restando 
un desarrollo del otro, obtenemos 


(a, —48,) + (a, —ax) + ... + (4, —4;) = 0. 


Puesto que aquí (a,;—ajE€A,, ¡=1, 2, ..., s, tenemos según la 
hipótesis 
4,¿—4; =4,—4=... =4,—4,=0, 
es decir, 
Q,=4,, 4,¿=03, »»., 44=4,, 


Hemos demostrado la proposición. 

El teorema que sigue está relacionado con el empleo de los pa- 
réntesis en las sumas directas. 

TEOREMA 1. Si las descomposiciones de los subespacios lineales 


A= A, +A, +... +49, (3) 
A, =A, +A, + Pe +A, 


(4) 
A, =Y., +9A,, + ... E 
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son directas, la descomposición 
A=A, +A, FA + PA AAA As (5) 


también es directa; en otras palabras, si en una suma directa todo 
sumando es sustituido por su descomposición directa, se obtendrá de 
nuevo una descomposición directa. Reciprocamente, si la descomposi- 
ción (5) es directa. las descomposiciones (4) y (3) también son di- 
rectas. 

Demostremos primero la proposición directa. Sea 


O TA E A E A E A TA 
Escribamos esta igualdad en la forma 


a,+0,+...+4,=0, (6) 


donde 
a=44 +4, +... +Gim, (i=1, 2, ..., s). (7) 


Como que a,€ A, y la suma (3) es directa, de (6) se deduce que 
a/=4,>=...=0,=0 y la igualdad (7) se transforma en 


a4+0,+...+Gim=0 (i=1l, 2, ..., 8). (8) 
Pero la descomposición 
4,=A,, +9A,, +... 4- Um, 


es, por hipótesis, directa y por ello de (3) se deduce que a,, =4,,= 
=,.. *=G¡m,=0. Por consiguiente, la suma (5) es directa que es lo que 
se quería demostrar. Repitiendo los razonamientos en el orden con- 
trario, obtendremos la demostración de la afirmación recíproca. 

El teorema 1] permite considerar la suma directa de varios sub- 
espacios como el resultado de sucesivas sumas directas de dos su- 
mandos. Las condiciones que garantizan que la suma de dos subes- 
pacios sea directa pueden ser enunciadas de la siguiente forma 
conveniente. 

TEOREMA 2. Para que la suma de dos subespacios lineales de un 
espacio Y sea directa es necesario y suficiente que la intersección de 
estos subespacios sea nula. 

En efecto, si la intersección de dos subespacios Y y B contiene 
un vector no nulo a, para el vector o se puede escribir la descom- 
posición 

a+ (— a) == O, 
donde aso, aEA y —a€Y, y, por consiguiente, la suma A + Y 
no será directa. Viceversa, si la suma A-+Y no es directa, para el 
vector nulo deberá existir la descomposición 


a+b=0 (axo, a€%l y bEB). 
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Puesto que b=—a, el vector b figura también en el subespacio A. 
Por consiguiente, la intersección nYB contiene, en este caso, un 
vector no nulo b, que es lo que se quería demostrar. 

TEOREMA 3. La dimensión de una suma directa de subespacios es 
igual a la suma de las dimensiones de estos subespacios. 

Si tenemos dos sumandos, entonces la dimensión de la suma es 
igual, de acuerdo con el p. 6.1, a la suma de las dimensiones de 
los sumandos menos la dimensión de la intersección. Pero, según 
el teorema 2, la intersección de subespacios en el caso de una suma 
directa es nula y su dimensión es igual a cero. Por esto, la dimen- 
sión de una suma directa de dos subespacios es igual a la suma de 
sus dimensiones. Si se tiene más de dos sumandos, la demostración 
se realiza fácilmente por inducción. 

Del teorema 3 se desprende el siguiente corolario: si el subespa- 
cio M es la suma directa de los subespacios A,, ..., A,, entonces, 
escogiendo en cada subespacio Y, una base A;,, Gia» -.-. Qm, li=1l, 2, 

... S) y uniendo estas bases en un sistema 


Art» Asa ...¿- C1im,> ...p Gor» Gs ... 3 Asno» (9) 


obtendremos una base del subespacio YU. 

Efectivamente, todo vector del subespacio A, se expresa linealmente 
en términos de los vectores (9) y por esto cualquier vector de A 
también se expresará linealmente en términos de los vectores (9). 
En virtud del teorema 3, el número de vectores del sistema (9) es 
igual a la dimensión del subespacio A. Luego, el sistema (9) es 
una base de 9, que es lo que se quería demostrar. 

El teorema 3 admite la siguiente inversión: si la dimensión de 
una suma de subespacios lineales es igual a la suma de las dimen- 
siones de los mismos, la suma es directa. 

Sea primero A A, + A, y sea 


dim. A=dim. A, + dim. Y,. 


En virtud del teorema del p. 6.1, de aquí se deduce que la dimen- 
sión de la intersección A, NA, es igual a cero, es decir, que esta 
intersección es nula. Á su vez, de aquí se deduce, de acuerdo con 
el teorema 2, que la suma A,4-YA, es directa. Si el número de 
sumandos es mayor que dos, es suficiente aplicar para la demostra- 
ción la inducción. 


6.3. Sistemas de ecuaciones lineales homogéneas. Con el fin de 
ilustrar la teoría de subespacios lineales consideremos el problema 
de resolución de los sistemas de ecuaciones lineales homogéneas, es 
decir, de los sistemas de tipo 


E,%1 +E%: + - +. +FEntn1 = 0, 


(1) 
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donde a,, son elementos de un cuerpo K, mientras que E,, ..., É, 
son las incógnitas; los valores de las últimas se buscan en el cuer- 
po ES . Sá sistema (1) puede ser representado en la siguiente forma 
matricia 


x-A=0, (2) 


donde x=[8, ..., E,] es la fila de incógnitas y A=/|«,,(| es la 
matriz en la que la /-ésima columna está formada por los coefi- 
cientes de la ¡-ésima ecuación del sistema (1). La fila nula [0,..., 0] 
ofrece una solución del sistema (1) cualesquiera que sean los coefi- 
cientes «y, Esta fila se llama solución nula o trivial del sistema (1). 
La existencia de la solución trivial indica que un sistema de ecua- 
ciones lineales homogéneas nunca es contradictorio. 

Para poder estudiar con más detalle las propiedades de las so- 
luciones del sistema (1) indiquernos por Y el espacio de filas de 
longitud n sobre el cuerpo K y consideremos toda solución (E%, ..., 
2] del sistema (1) como un vector x del espacio Y que satisface 
la ecuación (2). El conjunto de todas las soluciones de la ecuación 
(2) es un subespacio lineal del espacio Y. Efectivamente, de (2) y 
de y A=0 se deduce que 


(Ax + py) A =2 (<A) + y (yA) =0 


cualesquiera que sean A, € K. En otras palabras, una combinación 
lineal arbitraria de soluciones del sistema (1) es también una so- 
lución del sistema (1). Puesto que el espacio Y es de dimensión n, 
el espacio de soluciones del sistema (1) es de dimensión no mayor 
que rn. 

Se dice que unas soluciones x,, ..., x, del sistema (2) forman 
un sistema fundamental de soluciones de (2), si cualquier solución 
del sistema (2) puede ser representada en forma de una combinación 
lineal A4,x,+... +4,x, de las- soluciones indicadas y, al mismo 
tiempo, ninguna de las soluciones x,, ..., Xx, puede ser representada 
como una combinación lineal de las restantes. En términos de la 
teoría de espacios lineales esto significa que el conjunto x,, ..., xs 
es simplemente una base del subespacio de soluciones y que el número 
de soluciones fundamentales es la dimensión del subespacio de so- 
Juciones. 

El rango de la matriz Á se llama rango del sistema homogéneo (1). 
Los sistemas homogéneos de tipo (1) representan un caso particular 
de los sisternas lineales generales estudiados ya en el p. 5.3. Emplean- 
do el teorema de Kronecker—Capelli demostrado en aquella oca- 
sión se obtiene fácilmente el siguiente teorema principal: 

TEOREMA SOBRE LAS ECUACIONES LINEALES HOMOGÉ ¿EAS. La dimen- 
sión del espacio de soluciones del sistema (1) de ecuaciones lincales 
homogéneas con n incógnitas es igual a la diferen a n—r, donde r 
es el rango del sistema (1). 
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Si r =n, el sistema (1) debe tener, según el teorema de Kronecker— 
Capelli, tuna solución única que es, por consiguiente, la solución nula. 
El subespacio de soluciones consta solamente del vector nulo y su 
dimensión es igual a O, es decir, coincide con la diferencia n—r. 

Sea r<n. En virtud del teorema de Kronecker-—Capelli, el 
sistema (1) será en este caso (después de realizar de nuevo una enu- 
meración adecuada de las incógnitas y de las ecuaciones) equiva- 
lente a un sistema de tipo 


ES Errar ++ En nao 
a (3) 


1... 0. '0.. 00.20:sm0we.omoVW£ 


donde y,, son determinados elementos de K. A las incógnitas 


Enrro - +» E, se les puede asignar aquí cualesquiera valores de K. 
Tomando sucesivamente 
i (Er +00 Es+s “».p E,,) "= (1, O, esp 0), 


CPE AA A AN 


[Eno Eu 2... E] =[0, 0, ..., 1] 


y calculando toda vez los valores de las incógnitas E,, ...., E, según 
las fórmulas (3), encontramos el siguiente sistema de soluciones de (1): 


Al. LAA VYr+t, Pp» t, 0, ...p 0], 
Ca= Í[Yr+e, 1 <->) Yrra, ro 0, l, ..., 0), 
SAL o O E e ES (4) 
Cr=r = [Yn:> <-> Pap O, 0, e... 1]. 


Sabemos que el número de filas linealmente independientes en el 
sistema €,, ..., Cr-y, coincide con el rango de la matriz formada por 
estas filas. Pero de (4) se ve que la matriz indicada contiene un 
menor, formado por las últimas n—r columnas, que es la matriz 
unidad. Por esto, el rango de la matriz es igual a n—r y, por 
consiguiente, todos los vectores c,, ..., C,-, son linealmente inde- 
pendientes. Por otro lado, las fórmulas (3) muestran que toda solu- 
ción x=[8%, ..., 62] satisiace la relación 


x= rs + ... «t- Elge + 


es decir, es una combinación lineal de las soluciones C,, ..., Cy». 
Hemos verificado de esta forma que el sistema c,, ..., €,., es uña 
base del espacio de soluciones del sistema (1) y, por esto, la di- 
mensión de dicho espacio es igual a n—r. 

Indiquemos dos corolarios directos del teorema demostrado, 


112 Cap. 11. Espacios lineales 


COROLARIO 1. Para que un sistema de n ecuaciones lineales homo- 
géneas de n incógnitas 


E,%,1 + ... +En%g1 = 0, | 
EZ + a. “Eran = 0 

con coeficientes de un cuerpo cualquiera K no tenga soluciones no nulas, 

es necesario y suficiente que la matriz de esta sistema 


in --- Ang 
sea invertible. 

Efectivamente, la condición n=r significa que el rango de la 
matriz A debe coincidir con su orden, es decir, la matriz A debe 
ser invertible. 

COROLARIO 2. Para que un sistema de n ecuaciones lineales homo- 
géneas de n incógnitas con coeficientes de un cuerpo conmutativo tenga 
solución no nula es necesario y suficiente que el determinante de la 
matriz de este sistema sea igual a cero. 

En efecto, una matriz cuadrada formada por elementos de un 
cuerpo conmutativo no es invertible si, y sólo si, su determinante 
es igual a cero. 

Hermos visto que el teorema sobre las ecuaciones lineales homo- 
éneas es un corolario directo del teorema de Kronecker — Capelli. 

l último teorema, además de ser cierto para los sistemas lineales 

con coeficientes a la derecha, tiene lugar también para los sistemas 
lineales con coeficientes a la izquierda. Por esto, junto al teorema 
sobre las ecuaciones lineales homogéneas y al corolario 1, son válidas 
las proposiciones análogas relacionadas con sistemas de ecuaciones 
lineales homogéneas con coeficientes a la izquierda, a saber: el con- 
junto de soluciones columnas x= (£?, ..., £7] de un sistema de ecua- 
ciones lineales homogéneas 


2115, + . e. + 21585 = 0, | 


(5) 


con coeficientes de un cuerpo XK es un subespacio lineal del espacio 
formado por todas las columnas de longitud n sobre K. La dimen- 
sión de este espacio de soluciones es igual a n—r, donde r es el 
rango de la matriz A=|| ol]. en la que la ¿-ésima fila está formada 
por los coeficientes de la ¿-ésima ecuación del sistema (5). 
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J. Hállese la dimensión del subespacio lineal tendido sobre tos vectores 
a==(1, 3,2, 1), b=14, 9, 5, 4] y c=[(3, 7, 4, 3]. 

2. Si €,, €q. --., €) es una base de un espacio lineal Y y Ay es vi subespacio 
lineal tendido sobre e;, se tiene 


f 9, +9, + ... +9, 


3. Para todo subespacio propio A de un espacio L existe un subespacio 
lineal 'B, tal, que L=94+%Y. 

4. Demuéstrese la siguiente generalización del teorema 2 del p. 6.2: para 
que la suma de varios subespacios lineales dados sea directa es necesario y su- 
ficiente que cada uno de los subespacios dados tenga intersección nula con la 
suma de Jos restantes. 

5. Demuéstrese que la intersección de todos los subespacios lineales de un 
espacio Y, que contienen a los subespacios lineales dados, es igual a la suma de 
los últimos. 

6. Demuéstrese que para cualesquiera subespacios Y, Y y KG de un espacio 
lineal tienen lugar las ígualdades 


A (18 + 6) =4Y +96, 
(U 4D) A+ 6) =U4- (14D) 6, 


pda para abreviar, la intersección de subespaclos se Indica igual que el 
producto. 

' 7. Todo espacio lineal € de dimensión infinita contiene un subespacio línea) 
propio cuya dimensión coincide con la dimensión de todo el espacio C. 

8. ¿Para qué valores de A (del cuerpo de los números complejos) el sistema 
de ecuaciones 


2x4 y— 2 máx, 
x+ ly— 2:20 
tiene solución no nula? ¿Para qué valores de A el espacio de soluciones de este 
sistema es de mayor dimensión? 
9. ¿Para qué valores del parámetro A el sistema de ecuaciones 
x+ A 
Ax + 3y + AZ um 2 


x+2y=142=y, | 


es compatible? 
10. ¿Qué dimensión tienen los espacios de soluciones de los sistemas 


rt ly+ l2=0 x —y +2 == Y 
lx +ky— zz () y xi+y—z =0 | 
x—iy+ (21=/)2==0 | rx —yl 4-2 (21— ])=0 


considerados sobre el cuerpo de los cuaternios (p.]1.5)? 

1!. ¿Existe un polinomio en variables cuaternias a,b, e y d y con coeficien- 
tes cuaternios, tal, que su anulación sea la condición necesaria y suficiente 
para que el sistema de ecuaciones lineales 

ax+by==0 y cx+dy=0 
tenga solución no nula? Ñ ; E 

12. ¿Existe un polinomio en a, a, b, b, c, c, d y 4 que satisfaga las exlgen- 

cias del ejercicio anterior? 


8—1843 


Capítulo 111 Aplicaciones lineales 


El objetivo principal de este capítulo es el estudio de las pro- 
piedades de las aplicaciones de espacios lineales. En los parágrafos 
8 y 10, así como en los puntos 9.1, 11.1 y 11.2, el cuerpo principal 
no se somete a ninguna restricción. En los puntos 9.2, 9.3, 11.3 y 11.4 
y también en el $ 12 se supone que el cuerpo principal es un cuerpo 
conmutativo. En el $ 7, de carácter de introducción, se establece 
una serie de conceptos y de propiedades relacionados con aplicaciones 
de conjuntos absolutamente arbitrarios. 


$ 7. Aplicaciones de conjuntos arbitrarios 


7.1. Producto de aplicaciones. Consideremos un conjunto Ji de 


entes arbitrarios. Este conjunto puede estar compuesto tanto por 
un número finito como infinito de elementos. Se llama aplicación 
del conjunto Wi toda ley que permite a partir de 
cualquier elemento del conjunto M encontrar de 
nuevo un elemento de Mi. Convendremos en in- 
dicar las aplicaciones por las letras 4, 3, ... 
Si m es un elemento de Wi, indicaremos por 
má aquel elemento del conjunto M que se 
obtiene del elemento m mediante la aplicación 4. 
El elemento mA se denomina imagen del ele- 
mento m en la aplicación 4, mientras que m se 
denomina imagen reciproca del elemento mA, 

Consideremos, a título de ejemplo, el con- 
junto de todos los puntos del plano y sea “UL 
la aplicación que consiste en el giro de los puntos de este plano 
alrededor de uno de sus puntos O en 90” en contra del movimiento 
de las agujas del reloj (fig. 2). 

Recurriendo a la figura, vemos que 

auú=b y cU=d, 


Fig. 2. 
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Análogamente, si £D significa el traslado de los puntos en una unidad 
paralelamente al eje Oa, se tiene. 


aD=c y bD=f. 


Dos aplicaciones 4 y B del conjunto Mi se llaman ¡guales, si 
para todo elemento m de WM se tiene. 


MA = MR. 


Uno de los conceptos principales de la teoría de aplicaciones 
es el de producto de aplicaciones que se introduce del modo siguien- 
te. Sean 4 y 3 dos aplicaciones del conjunto W?. La primera 
transforma un elemento arbitrario m del conjunto Vi en m4. Si este 
nuevo elemento se somete a la aplicación A, se obtendrá el elemento 
(mA) 3. La aplicación que transforma el elemento m directamente 
en (m4) 3 se lama producto de A por D y se designa 43. Es decir, 
se toma por definición que 


Jn (AD) == (mA) 32. 


Si al elemento m se aplica primero la aplicación 4% y después la 
aplicación 4, se obtendrá el elemento (mB) 4 que puede no coin- 
cidir con (m4) 3. Efectivamente, en el ejemplo con el plano, con- 
siderado anteriormente, se tiene 

a(UD) =(A1) D=bD =f, 

a(DuU) = (aD) U =cU =d 
y, por consiguiente, UD +£DU. Por lo tanto, el producto de apll- 
caciones depende, en general, del orden de los factores. Vemos, pues, 
que una de las leyes principales que se verifica para el producto 
de los múmeros no se cumple para las aplicaciones. Sin embargo, 
la otra ley principal —la asociatividad de la multiplicación —se con- 
serva para las aplicaciones. En efecto, sean 4, 3 y 8 aplicaciones 
arbitrarias del conjunto *D! y sea m uno de sus elementos. Por de- 
finición, tenemos 


Mm(AB) E) = (m(ABD) E =U(RA) DY E, 
Mm(A(BE)) = (Mi) (BE) =((MA) DD) E, 


(AB) € = A (BÉ). 
Empleando esta ley es fácil deducir que el producto de cualquier 
número finito de aplicaciones, tomadas en un arden determinado, no 
depende de la disposición de los paréntesis. Ásíi, por ejemplo, 


(AB) (6D) = (48) 8) D =(4 (B8)) D =1 (BÉ) D). 
Por esto, en los productos que contienen varios factores se pueden 


omitir los paréntesis y se puede hablar simplemente del producto 
de dos, de tres y de un número mayor de aplicaciones. El producto 


de donde 


8? 
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de n factores iguales a 4 se llama n-ésima potencia de la aplicación y 
y se indica por 4”. Las operaciones con las potencias se realizan 
siguiendo las reglas corrientes 


ACA" = 7 A (1) 
(47) =aA""; (2) 


la demostración de las mismas es evidente. 

Si el producto de dos aplicaciones «¿ y W3 no depende del orden 
de los factores, se dice que 4 y %H son permutables o que conmutan. 
La fórmula (1) señala que las potencias de una misma aplicación 
son permutables. 

Si las aplicaciones .£ y HB conmutan, se tiene 


(ABYP =ABAR = AABR = AB 
y, en general, 
(AB =A"R". (3) 
En cambio, sí 4 y B no conmutan, la fórmula (3) puede no tener 
lugar. 
7.2. Las aplicaciones idéntica e inversa. Entre todas las aplica- 


ciones de un conjunto * desempeña un papel especial la aplicación 
que pone en correspondencia a todo elemento m de este conjunto 
el propio elemento m. Esta aplicación leva el nombre de aplicación 
unidad O idéntica y será indicada en adelante por $. Es decir, para 
todo m se tiene 


mó == m. 


Sea 4 una aplicación arbitraria del conjunto Di. Puesto que 


miS A) =(mb) A =maA 
y 
m(4A6) =(mi) $ =maA, 
se tiene 
SA =AS =4. 


Si dada la aplicación 4 se puede hallar una aplicación 3 tal que 
ABBA =6, (4) 

se dice que BH es la inversa de 4, mientras que 4 se denomina 
invertible, Es fácil ver que toda aplicación invertible tiene sólo una 


inversa. Efectivamente, si 4 posee dos aplicaciones inversas A y €, 
entonces, multiplicando la relación 


Ab =6$ 
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a la izquierda por 33 y empleando las igualdades (4) y la asocia- 
tividad de la multiplicación de las aplicaciones, obtenemos 
$6 =3B6, es decir, 8 = 3H. 

La aplicación inversa de 4 se indica por 47'. Las relaciones (4) 
son simétricas respecto a 4 y 3; por esto, sí 3 es la inversa de 4 
resulta que .4 es la inversa de 3, es decir, 

(AU = A. (5) 
Tomemos por definición 


AZ3 E Y ATI=Z(ACTY (n=1,2,3, ...). 


De (4) y (5) se deduce fácilmente que las fórmulas (1) y (2) son 
válidas no sólo para exponentes enteros positivos, sino para todos 
los exponentes enteros. En particular, 


(4")7 =(d4 Y =aA""., 
AB-B AMS 


Además, la relación 


implica que as 


7.3. Aplicaciones biyectivas. No toda aplicación es invertible. 
El teorema que sigue ofrece un criterio simple de aplicaciones in- 
vertibles. 

TEOREMA Para que una aplicación A de un conjunto Mi sea 
invertible es necesario y suficiente que A sea una aplicación biyectiva 
del coniunto AM sobre si mismo, es decir, que para todo elemento 
de Wi exista en M su imagen reciproca y que distintos elementos 
de Wi se transformen por la aplicación A en distintos elementos. 

Demostremos primero la necesidad. Supongamos que 44 posee la 
aplicación inversa B, de manera que 


AB=RBA =$. 


Tomemos en M un elemento cualquiera rn y sea mA3=n. Multipli- 
cando esta relación por .4 y sustituyendo 34 por $, obtendremos 
m=nA, es decir, todo elemento m de Di es la imagen de un ele- 
mento » de M. Por otro lado, si dos elementos mm, y sn, son trans- 
formados por la aplicación 4 en un mismo elemento 


MA = Ml, 


entonces, multiplicando esta relación por 3, obtenemos m, =m,. 
Por consiguiente, todo elemento de M tiene en DI sólo una imagen 
reciproca. 

Demostremos ahora la suficiencia de las condiciones. Según éstas, 
para todo elemento m del conjunto Di existe un elemento, y sólo 
uno, /, tal que 

nÁ = mM (6) 
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Indiquemos por 3 la aplicación que transforma m en n. Es decir, 

mB= n. (7) 

Multiplicando (7) por 4 y empleando la igualdad (6), obtenemos 
m(BA) =n 4 =m, 


Puesto que m es un elemento arbitrario, de aquí se tiene B.4 = $. 
Análogamente, multiplicando (6) por W4 y empleando (7), obtenemos 
vB =$. Por consiguiente, HB es la aplicación inversa deseada. 


7.4. Sustituciones. Las aplicaciones de conjuntos finitos se re- 
presentan, generalmente, mediante tablas, colocando en la primera 
fila de las mismas los símbolos de los elementos del conjusito dado 
en cierto orden y debajo de ellos los símbolos de los elementos que 
les corresponden. Por ejemplo, 


123 
o=(3 l 2) 
es aquella aplicación del+ conjunto de los números 1, 2, y 3 en 


e 
la que el 1 se transíorma en el 3, el 2 enel 1 y el 3 en el 20, 
empleando la notación aceptada anteriormente, 


lo=3, 20=1 y 3a=2. 


Las aplicaciones invertibles de conjuntos finitos se llaman 
sustituciones. Para que una aplicación representada en forma de 
una tabla sea una sustitución es necesario y suficiente que tanto 
en la fila superior como en la inferior aparezcan los símbolos de 
lodos los elementos del conjunto, con la particularidad de que todo 
elemento figure sólo una vez. Para representar la sustitución 
inversa 07? basta, evidentemente, convertir la fila inferior de la tabla 
de a en la superior y la superior en da inferior. 


F(X, ..., xn) una función de las variables x,,.... %, 
y sea O una sustitución de los números 1, ..., n. El resultado de 
a sustitución gu aplicada a las variables x,, ..., Xx, de la función F 


es, por definición, la expresión 
rOo=Fla sm) 


De esta definición se deduce directamente que para cualesquiera 
sustituciones p y ou y para cualesquiera funciones F y G de 


Xi, «».» X, Se tiene 
F (po) = (Fp) o, (8) 
(FG)ar=Fa-Go y (F+6G)0=Fo +60. (9) 
Tomemos ahora para la función F la expresión 
Á= Il (x¿—xy =(x,—x,) (1, —Xy). Ax, —Xp) (x,—13). ea 
t<j 


“> (Xp 1 — Xp). (10) 
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Está claro que para cualquier sustitución o se tiene Ad= -+ A. 
Si Ao=A, se dice que «d es una sustitución par y, si Ac=-— A, 
se dice que o es impar. Para toda aplicación no invertible a, tene- 
mos Ac =0. Por esto, para cualquier aplicación a del conjunto de 
los números l, ..., n tenemos 


Ac =e,A, 


donde e, =-+1, si oO es una sustitución par, e, =—l, si O es una 
sustitución impar, y €,==0, si a es una aplicación no invertible. 
El valor del símbolo e, se denomina también signatura de la apli- 
cación 0. 

Para dos aplicaciones arbitrarias p y o tenemos de las fórmu- 
las (8) y (9) 


24 A = A (po) = (Ap)O =e,2,A, 
de donde 


Epa = Lolas 


es decir, la signatura del producto de aplicaciones es igual al pro- 
ducto de las signaturas de los factores. Puesto que la signatura de 
la aplicación idéntica es, evidentemente, igual a +1, resulta que 
la signatura de la sustitución inversa siempre coincide con la signa- 
tura de la sustitución dada. 

Se llama sustitución cíclica, o ciclo, (i,i,...¿,) la sustitución o 
en la que (¡0=Í,, ¿O=Íy, ..., [n.0= ip [no=f, e lo=i para 
los demás elementos í del conjunto, si es que existen. En particu- 
lar, se llama cíclo doble, o trasposición, (ij) la sustitución que 
cambie los elementos ¿ y ? y no altere los demás elementos. Cam- 
biando los índices 1 y 2 en la expresión (10) para A, veremos 
fácilmente que A(1 2) =—A, es decir, que el ciclo doble (1 2) es 
una sustitución impar. Por otro tado, mediante cálculo directo se 
comprueba que 


(100 2(1)=(02 y 6D N=( 1 


y puesto que, además, para cualesquiera p y o siempre e,., =8,, 
obtenemos 


ip" lepina n= tuo == y» 
es decir, todo ciclo doble es una sustitución impar. 
De aquí se deduce, además, que el producto de un número 
impar de ciclos dobles es una sustitución impar y que el producto 


de un número par de ciclos dobles es una sustitución par. En par- 
ticular, de la fórmula 


(123... m=(9Y(d03)... (mm, 
que se comprueba fácilmente, se deduce que un ciclo (i, ¿,... in) de 
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longitud par m es una sustitución impar y que un ciclo de longitud 
impar es una sustitución par. 

Es claro que los ciclos sin elementos comunes representan susti- 
tuciones que conmutan. Ál mismo tiempo, cualquier sustitución 
puede ser descompuesta fácilmente en un producto de ciclos sin 
elementos comunes. Para ello se toma un elemento cualquiera ¿, 
del conjunto y se mira en que elemento ¿, lo transítorma la susti- 
tución. Si resulta que ¿,=¿,, obtenemos para el primer factor el 
ciclo unidad (í,), es decir, la sustitución idéntica. Si resulta que 
¿, 721, tomamos la imágen í, del elemento ¿,. Para ¿(¿=i, obtene- 
mos el factor en forma del ciclo (i, ¿,); si f, 56 1, pasamos a conside- 
rar la imagen ¿, del elemento ?,. Si resulta que ¿¿=i,, el ciclo se 
cierra y se obtiene el factor (i, i, ¿s). etc.; considerando uno tras 
otro todos los elementos del conjunto, obtenemos la descomposición 
de la sustitución en ciclos sin elementos comunes. Por ejemplo, 
tenemos 


A 
34521 


Multiplicando las signaturas de los ciclos obtenemos que e, = —1. 

Existe también otra forma para determinar la signatura de urta 
sustitución: mediante el cálculo del número de las así llamadas 
inversiones, Ál representar las sustituciones en forma de tablas 
hemos convenido en que los elementos del conjunto que figuran en 
la fila superior pueden ser dispuestos en un orden arbitrario. Sin 
embargo, en el caso en que el conjunto considerado es la colección 
de los números enteros, podemos convenir en escribir los números 
de la primera fila en el orden de crecimiento. En este caso la 
sustitución quedará plenamente determinada al indicar solamente 
la fila inferior de la tabla, es decir, al indicar una permutación 
de números. La correspondencia entre las sustituciones y las permu- 
taciones, obtenida de esta forma, resulta biyectiva y obtenemos la 
posibilidad de representar las sustituciones en forma de tablas de 
una fila en lugar de tablas de dos filas. Sea o una sustitución que 
corresponde a la permutación ¿,, iz ..., ¿, de los números l, 2, ..., n. 
Consideremos todos los pares i,, ¿, (R< f); diremos que el par ¿z l, 
forma una inversión, si i, > t,. De la relación 


Ao = 1 (xo — 10) = 111 (X, —4,) 


¿< 


J=0 3 5)(2 4). 


se ve que e,= 1, si es par el número de factores x,, —x;, para los 
cuales ¿¿>¿¿, y que e£,==—1, si el número de estos factores es 
impar. Por consiguiente, la paridad de la sustitución o coincide 
con la paridad del número de inversiones en la permutación 


ba. la, ..o.p Ls 
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Ejemplos y problemas 


J. Tomemos en el espacio corriente un sistema rectangular de coordenadas 
OXYZ. Sea A el giro del espacio alrededor del eje OX en 90” en dirección de 
OY hacia OZ, sea H el giro en 90? alrededor del eje OY en dirección de OZ 
hacia OX sea € el giro en 90? alrededor del eje 0Z en dirección de OX 
hacia OY. Sea m el punto de coordenadas (1, 0, 1). Calcúlense las coordenadas 
de los puntos m4, m(B8) y m(83). Demuéstrese 
que 


ABS Eli, ARA RA Y MZA. 


) 
2. Consideremos dos aplicaciones 4 y BG de un | 
conjunto arbitrario M aceptando que $ es invertible ¿1 y 
' 
' 


Z 
se 


Tomemos un elemento cualquicra « de M y sea le 

v=u4A. La aplicación $ «traslada» los elementos u y ; A 

ven unos elementos xe y. Demuéstrose que en estas NN Do 

condiciones la aplicación £-!48 transforma x en y vr” 4 e 
ES 


(fig. 3). 
Ñ 3, Sea O un punto arbitrario del plano, sea A el 
iro del plano alrededor del punto O en un ángulo 
terminado a y sea 3 el traslado paralelo del plano 

a una distancia a cn una dirección determinada. Demuéstrese que B-!4B es 

el giro en el ángulo au alrededor del punto OB y que A“! BA es el traslado del 

plano a la distancia a en la dirección que se obtiene girando en el ángulo a 

la dirección inicial. 


Fig. 3. 
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8.1. Propiedades elementales. Se llama aplicación de un espacio 
lineal “Y una ley que a todo vector de Y pone en correspondencia 
de nuevo un vector determinado de £. Una. aplicación se llama 
lineal, si transforma el producto de un número por un vector en 
el producto del mismo número por el vector correspondiente y la 
suma de vectores en la suma de los vectores correspondientes. 
Abreviando, una aplicación 4 se llama lineal, si para cualesquiera 
vectores x e y del espacio Y y para cualquier número a del cuerpo 
de coeficientes tienen lugar las igualdades 


(ax) 4 =a (x4), (1) 

(+ y) 4 =xd + yA. (2) 
Tomando a.=0 en (1), obtenemos 
0Á =0, 


es decir, toda aplicación lineal transforma el vector nulo en el vec- 
tor nulo. 

De (1) y (2) también se desprende directamente la siguiente 
propiedad principal de las aplicaciones lineales: sí 4 es una apli- 
cación lineal, se tiene 


(2%,X, + %X34H +. FAA) A = A (AA) EA AA) RA FA (A), (3) 
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donde X,, Xy, --., Xx, son vectores arbitrarios de Y y %,, %y, -.., Un 
son números arbitrarios del cuerpo de coeficientes. 

Para la demostración basta aplicar la inducción según m. Para 
m=1 la fórmula (3) coincide con (1). Supongamos ahora que (3) 
es válida en el caso de m—1l sumandos. Entonces 


(0%, FOX E HO) A (01, E (0 FU) A 
= (0,X,) AF (LH Ak) A = 
== (A) +0 (AIR E On (At), 


que es lo que se quería demostrar. Para m=2, la fórmula (3) se 
convierte en 


(ax + Py) A = a (x4) +8 (ya), (4) 


de donde para PB=0 y a=fP=1 se obtiene de nuevo (1) y (2). 
Por consiguiente, Ja propiedad (4) caracteriza totalmente las apli- 
caciones lineales y puede servir de definición de las mismas. 

Hemos convenido anteriormente en llamar aplicación idéntica $ 
aquella aplicación que transforma todo elemento en sí mismo. Por 
esto, si el conjunto considerado es la colección de los vectores de 
un espacio lineal €, se tiene 


(ax + By) $ = ax+ By = 0. (x6) + P (y6). 


Por consiguiente, la aplicación idéntica de un espacio vectorial 
es lineal. La aplicación que transforma todo vector en el vector 
nulo se llama nula y se indica por 6. Está claro que la aplicación 
nula también es lineal. 

Consideremos dos ejemplos concretos. Sea Ni el espacio vectorial 
corriente, es decir, el conjunto de segmentos orientados que parten 
de un punto fijo O. Consideremos un paa que pasa por O e indi- 
quemos mediante x4 la proyección del segmento x sobre este plano. 
Entonces las conocidas propiedades de las proyecciones — 1) la proyec- 
ción de una suma de segmentos es igual a la suma de sus proyec: 
ciones y 2) si un segmento es aumentado en «a veces, su proyección 
también se aumenta en a veces— pueden ser representadas en forma 
de las igualdades 


ATHFYA=xA+FYyA y (ax A=a (xd), 


de las cuales se desprende que la operación de proyección es una 
aplicación lineal. , 
Como segundo ejemplo consideremos el conjunto de todos los 
polinomios en la variable A de orden no mayor que n. Estos poli- 
nomios forman, respecto a las operaciones corrientes de adición y de 
multiplicación por número, un espacio lineal de dimensión n2+1. 
Pongamos en correspondencia a todo polinomio su derivada. Puesto 
que la derivada de una suma es igual a la suma de las derivadas 
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de los sumandos y puesto que un factor constante puede ser extraído 
del signo de la derivada, resulta que la operación de diferenciación 
es una aplicación lineal del espacio de polinomios. 

Veamos ahora mediante qué elementos puede ser definida una 
aplicación lineal. 

TEOREMA Sea a,, 4, ..., a, una base de un espacio lineal £, 
Tomemos en Y unos vectores absolutamente arbitrarios b,, ba, ..., b,,. 
Entonces existe una aplicación lineal del espacio Y, y sólo una, que 
transforma los vectores 4,, Ay ..., an en los vectores b,, Dz, .. 
respectivamente. 

Para construir la aplicación deseada, tomemos un vector arbi- 
trario x y representémoslo linealmente en términos de la base 
Q,, Aa, ..., Ay. Sea 


x=E10,+É02+... +É,0,- (5) 
Consideremos el vector 
x= 510, E Ex, tf... + EP 


Indiquemos por 4 la aplicación que transiorma x en x'. Por con- 
siguiente, si x está representado por (5), se tiene 


xÁ = Eb, + E,b, +... + Edy: (6) 


Tomando aquí E¿=1 y E,=0 (¡3i, ¡=1, 2, ..., n), obtenemos 
a, A=b, (i=1, 2, ..., n), de modo que la aplicación 4 transforma 
los vectores a,, ..., 4, en b,, ..., b,. Demostremos que yx es 
lineal. Multipticando (5) por un número cualquiera a, tendremos 


ax= (06,) a, + (051) ++... +(0,) Qn- 
Comparando este resultado con (6), obtenemos 
(ax) A = (a5,)b, + (a51)01+... +(06n) Oy, 


(ax) A = a (x4). (7) 


es decir, 


Sea 
Yy=N,/0, +4 +-... + Na 
otro vector de €, Entonces se tiene 
x+yaE +9) + (+9) A+. + (E, +0.) 4, 
y, por consiguiente, 
yA =ND, +0 +... EUba, 

A+ yA =(E+0)0,+... +(En + n)0,- 

De la última igualdad resulta 
x+ygA=ED E E ENE 0 Xd A Ya. (8) 

Las propiedades (7) y (8) significan que Y es lineal. 
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Resta probar que toda aplicación lineal %B que transforma 


A, ..., An en b,, ..., b, coincide con 4. Por hipótesis, a; = b, 
li E 2, ..., n). Luego, si el vector x está representado por (5), 
se tiene 


xB=E, (A, DB) + ... +5, (a, B) =E,b, +... + En XA, 
es decir, B=.W4. Hemos demostrado el teorema. 
8.2. Matriz de una aplicación lineal. Veremos ahora cómo se 


puede definir una aplicación lineal mediante números. Tomemos en 
el espacio £ un sistema cualquiera de coordenadas a,, Q,, ..., Gn 
y supongamos dada una aplicación lineal 4 de este espacio. La 
aplicación 4 transforma los vectores a,, ..., a, en unos vectores 
ajA, AA, ..., 4, A que pueden ser expresados linealmente en tér- 
minos de a,, Aj, ..., a,. Sean 


QA = 010, 40110,+... + QnUo, 
AJA = 00, + Om +... + Ayna» 


AA = Any + Onda E RO 
estas expresiones. La matriz 


%. Ar .... Ann 
A = Aa) zo ..». en 
Any Aa2 ... Can 


formada por las filas coordenadas de los vectores 4,4, ..., Qpd, 
se llama matriz de la aplicación 4 en el sistema de coordenadas 
1 Ap ..., Ap. Por consiguiente, dado un sistema de coordenadas, 
a toda aplicación lineal corresponde una matriz determinada. Surge 
la pregunta de si esta correspondencia es biyectiva. La respuesta 
es positiva ya que conociendo la rnatriz A podemos encontrar pri- 
mero los vectores 


b, =010, + 03094 .-- +2 58p, 


y después construir, de acuerdo con el teorema del punto anterior, 
la aplicación lineal 4 que transforma a,, ...,0,enb,..., 0d, 
respectivamente. Esta aplicación es única y su matriz coincide, 
obviamente, con la matriz A que es lo que se quería demostrar. 

Veamos qué matrices corresponden a las aplicaciones idéntica 
y nula del espacio £. Sea a,, a,, ..., e, un sistema arbitrario de 
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coordenadas de Y. Entonces tendremos 
a60=0:4a,+...+0:4,, a$ =1-a,+...-+0-4,, 


a,0=0:-4,+...+0-4, a,8 =0-4,+...+1-:4,. 


Por consiguiente, la aplicación nula tiene la matriz nula y la apli- 
cación idéntica tiene la matriz unidad. 

Planteémonos el problema: ¿cómo conociendo la matriz de una 
aplicación lineal 4 y las coordenadas de un vector x determinar 
las coordenadas del vector xA4? 

Sea G,, Ga, ... , A, el sistema de coordenadas escogido y sean 
0 Es las coordenadas del vector x en el mismo. Indique- 
mos por «¡y (i, j=1, ... , n) los elementos de la matriz A de la 
aplicación 4 calculados en este mismo sistema de coordenadas. 

enemos 


x=É,0, +Eya, + ... + Ent 
xA =ÉE, (4, A) + Esla A) +. +En (0,4). 


Según la definición de la matriz de una aplicación se tiene 
GA == 0, + ly O li=al, ..., n). 
Introduciendo estos valores en la igualdad anterior, obtenemos 


XA = (Ey + Epa E + HEN) 05. .- 
PE + (E,%, n + ósUan + es + En % an) Ap» 


Por consiguiente, la fila de coordenadas del nuevo vector x4 es 


[XA] = [E,%)1 + +. +Enlo + «> + Elim > + FE Lon] = [x] A, 


es decir, la fila de coordenadas del vector nuevo es igual a la fila 
de coordenadas del vector antiguo multiplicada por la matriz de la 
aplicación lineal: 


[x4] = [x] 4. 


8.3. Transformación de coordenadas. En el punto anterior ha 


sido establecida una correspondencia biyectiva entre las aplicaciones 
lineales de un espacio vectorial £ de n dimensiones y las matrices 
cuadradas de orden n. Sin embargo, para ello ha sido necesario 
escoger primero en *Y un determinado sistema de coordenadas. Si 
cambiamos éste, cambiamos la correspondencia. Tendremos como 
resultado que a una misma aplicación lineal .4 corresponderán en 
los sistemas antiguo y nuevo de coordenadas diferentes matrices A 
y A,. Hallemos la relación entre las mismas. 

Sean 4, Gp «+ Gn Y Go Gs ..., €: el antiguo y el nuevo 
sistemas de coordenadas sea T la matriz del cambio (véase el 
p. 5.1). Indiquemos por lx] y [x], las filas de coordenadas del 
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vector x en el antiguo y en el nuevo sistemas de coordenadas. De 
acuerdo con la regla de una aplicación lineal, tenemos en el sistema 
antiguo de coordenadas 


[x.4) = (x] A. 
En el nuevo sistema de coordenadas esta misma regla da 
[x4],=(x],4,. 


Sin embargo, la regla de transiormación de coordenadas del p. 5.1 
muestra que 


[x] = [x), T y [x4]=(x4],7. 


Introduciendo aquí los valores de [x4), [x4], y [x] de las igual- 
dades anteriores, obtenemos 


[x], TA=[x), 4,7. 


Puesto que el vector x es arbitrari' tenemos, aplicando el lema 
del p. 5.1, TA=A,T, o 
A, =TAT-". 


Es decir, la matriz de una aplicación lineal en el sistema nuevo de 
coordenadas es igual a la matriz de esta misma aplicación lineal en 
el sistema antiguo transformada por la matriz del cambio recíproco. 

Para concluir consideremos el problema de cómo puede ser 
interpretada, desde el punto de vista de la teoría de aplicaciones 
lineales, la matriz del cambio de un sistema de coordenadas por 
otro. Sean Q,, Q,, ..., €, Y Gi, 4, ..., A dos sistemas de coorde- 
nadas dados de un espacio £. Según el teorema del p. 8.1, existe 
una aplicación lineal Y, determinada unívocamente, que transforma 
el sistema antiguo de vectores coordenados en el sistema nuevo, es 
decir, que posee la propiedad 


- aS$ =4, (i=1, 2, ..., n). 


Para escribir ahora, según la regla del p. 8.2, la matriz de la apli- 
cación Y en el sistema antiguo, tenemos que expresar todos los 
vectores a, en términos de a,, ..., a,. Pero lo mismo tenemos que 
hacer para obtener la maíriz del cambio. Por consiguiente, la ma- 
triz del cambio es la matriz de la aplicación lineal que transforma 
el sistema antiguo de coordenadas en el sistema nuevo, calculada en 
el sistema antiguo de coordenadas. Es más, la última indicación 
es innecesaria, ya que al calcular la matriz de la aplicación $ en 
el sistema nuevo de coordenadas obtendremos la misma matriz del 
cambio T. En efecto, si la matriz de la aplicación Y en el sistema 
antiguo de coordenadas es T, la matriz del cambio también será T. 
Por lo tanto, la matriz de SY en el nuevo sistema será igual a 
TTT"*=T, que es lo que se quería demostrar. 


$ 9. Operaciones con aplicaciones lineales 127 


Ejemplos y problemas 


1. Consideremos el espacio de los vectores que pertenecen a un plano y 
parten de un punto O. Demuéstrese que la aplicación, consistente en el giro de 
odos los vectores en un ángulo «a alrededor del punto O, es lineal y que su 

cosa sena 


matriz es igual a | siempre que el sistema de coordenadas 
—Sen a cosa 


esté formado por dos vectores perpendiculares de longitud !. 

2. Sea HR el espacio corriente de los segmentos orientados que parten de un 
punto O. Tomemos en NR un sistema de coordenadas formado por trts vectores 
perpendiculares e,, €z y €g de longitud 1. Demuéstrese que la matriz de la 
aplicación dea $, consistente en la proyección de los vectores sobre el eje e,, es 


l 
igual a E e » , mientras que la matriz de la proyección sobre el plano 


e,€, es Igual a o 
gu 
11 


0 
3. ¿Cómo cambia la matriz de una aplicación lineal 4, si en el sistema de 
coordenadas €, éq, .... €. se cambian entre si dos vectores cualesquiera, por 


ejemplo, e, y ey? 

4. Toda aplicación lineal de un espacio de dimensión uno consiste en la 
multiplicación de todos sus vectores por un mismo número. 

5. Sea ( el espaclo de todas las matrices cuadradas de segundo orden. 
Demuéstrese que la aplicación 4, consistente en la multiplicación a la derecha 


de todes las matrices de £ por la matriz [2 _9], es Uneal. Hállese lo ma- 
triz de la aplicación 4 si como sistema de coordenadas de € se toma el sistema 


lo 0). [o 0]. [Li 0] » [o 1]- 


6. Una aplicación lineal ,A de un espacio ( de cuatro dimensiones tiene en 
el sistema de coordenadas e,, €y, €g y €, la matriz 


lt2 3 2 
—1 03 l 
215 - 
lt 2 2 


go será la matriz de esta aplicación, si para el nuevo sistema de coordena- 
as se toma el sistema 1) e,, €3, €s y €4; 2) €1, €1 +22, €1 +2 +83 y € + + +4? 
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9.1. Multiplicación de aplicaciones lineales. Sean 4 y ZW dos 
aplicaciones lineales definidas en un espacio lineal £. Aplicando a 
cualquier vector x de * primero la aplicación 4 y después la apli- 
cación BH, obtendremos un vector 


y =(xA) 32. 


La aplicación que transforma x directamente en y ha sido Mamada 
en el p. 7.2 producto de 4 por 3. Por consiguiente, 


(AB) = (XA) B. (1) 


es 


re 


128 Cap. 111. Aplicaciones lineales 


Demostremos que el producto de dos aplicaciones lineales es una 
aplicación lineal. Para ello es suficiente demostrar, según el p. 8.1, 
que tiene lugar la igualdad 


(ax 4- BY (AB) =0:x (48) +P y (13). 
En virtud de (1) se tiene 
(ax + By) (433) = ((u.x + By) 4) E. 
Puesto que yl y 4 son lineales, resulta 
((ax + By) 1) B= (a (xd) HP yA) B= 0 (XA) BH B (Y 3, 
es decir. 
(ax + Py) (4B) =0-x(4B) +B y (13) 
que es lo que se quería demostrar. 
Tomemos en el espacio Y un sistema de coordenadas e indique- 
mos por A y B las matrices de las aplicaciones 4 y B. ¿Cómo 
hallar Ja matriz de la aplicación 483? Indiquemos esta matriz 


incógnita por C. Sea x un vector cualquiera del espacio £ y sea (x] 
su fila de coordenadas. Según la regla de aplicación lineal, se tiene 


[x(48)] = [x) C. 
Por otro lado, tenemos 
X(AB)] = [(x 4) B] = [x4] B =[x] AB. 
Comparando ambos resultados vemos que 
(x] € =[x] AB 


cualquiera que sea x. De acuerdo con el lema del p. 53.1 de aquí 
se deduce que A 


es decir, la matriz de un producto de aplicaciones lineales es igual 
al producto de las matrices de estas aplicaciones. 

Consideremos una aplicación lineal biyectiva A. Si 4 transforma 
el vector x en y, la aplicación que transforma y en x será la apli- 
cación inversa 4A7* (véase el p. 7.3). Demostremos que siendo A 
lineal, también 4A7* es lineal. En efecto, sea 


udT?i=x y vd” =y, 


donde « y v son vectores arbitrarios de £. Puesto que la aplicación 
A es lineal, se tiene 


(ax+ By) A =0-xA+B yA = qu + Pu, 
de donde resulta 
(au + Pu) 47! =ax + By =a- ut + BB vuA7* 
que es lo que se quería demostrar. 
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Siendo A la matriz de la aplicación A y X la matriz de la 
aplicación 4”*, de las relaciones 


AA" =AMA=6b 
se deduce que 


AX =XAÑE, 


es decir, X =A”1. Por consiguiente, la aplicación inversa tiene la 
matriz inversa. En particular, para que una aplicación lineal sea 
invertible es necesario y suficiente que sea invertible su matriz. 

De nuestros resultados también se desprende directamente la 
siguiente regla: la matriz de la aplicación A” es igual a A", donde 
Á es la matriz de la aplicación A. 


9,2. Multiplicación por número y adición. En este punto y en 
el que sigue se supone que el cuerpo principal K es un cuerpo con- 
mutativo. La aplicación que resulta al aplicar a un vector primero 
la aplicación A y al A Pd después el vector nuevo por un 
número a se llama producto de a por 4 y se indica por adm. Esta 
definición se puede expresar mediante la fórmula 


x(at) =0a (x4). 


Razonando igual que en el caso de la multiplicación de aplica- 
clones lineales, veremos fácilmente que siendo A una aplicación 
lineal, también aA es una aplicación lineal. Determinemos su matriz. 
Supongamos que en un sistema de coordenadas fijado la aplicación 
A tiene la matriz 4 y la aplicación ay tiene la matriz B. Según 
la regla de una aplicación lineal, tenemos 


[x(a4)=[x]B y 
[x (a.4)] = [a (x4)] =a [14] =4 [x] A =(x] (0.4), 
de donde resulta que [x] B = Lx) (24), es decir, B=aA4A. 

Luego, la matriz del producio de Un número por una aplicación 
lineal es igual al producto de este número por la matriz de la apli- 
cación. 

Indiquemos, finalmente, las fórmulas 

a (B.4) = (ap) Á, 
0.4=0, 
l-Arm4A, 
A(ARB) = (9,4) Y = A (aB), 
análogas plenamente a las fórmulas correspondientes del cálculo de 
matrices. La demostración queda a cargo del lector. 

Tomemos ahora dos aplicaciones 4 y 3 de un espacio lineal 2 
y pongamos en correspondencia a todo vector x de £ el vector 
xA+x%. La aplicación que transiorma x en x4+x3 se indica 


9— 184,3 
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por 4+%3 y se denomina suma de A y 3. Es decir, por definición, 
A+ B) XA SE XGB. 
Si las aplicaciones 4 y 3 son lineales, se tiene 


(ax + By) (A+ B) = (ax + By) A + (ax + By) B = 
=40-X 1 + P yA+a BAP y 
=0 (XA + 1B) + Py + y) =0-x (A + BD) HB y(A + 3). 


Por consiguiente, la suma de dos aplicaciones lineales es una apli. 
cación lineal. Determinemos su matriz. Sean A y B las matrices de 
las aplicaciones A y MW en un sistema de coordenadas. Sea C la 
matriz de la aplicación 4 +3. Tenemos 


(x(4 48) =(x]C, 


E (A+ B)]=[(x4 +18] == [14] + [1383] = [x] A + [x] B = [x] (A+ B). 
or consiguiente, 

[x] C= (xJ(4+8B) y CmA+8B, 
es decir, la matriz de una suma de aplicaciones es igual a la suma 
de sus matrices. 

Las operaciones con aplicaciones lineales se rigen por las mismas 
leyes que las operaciones con matrices. Una parte de ellas, las rela- 
cionadas solamente con la multiplicación, ya las hemos indicado, 
Señalemos ahora también aquellas que se refieren o bien a la adi- 
ción o bien a las relaciones entre la adición y multiplicación: 


AF B=RBH A, 
AF BDHFE=A41+(B+68), 
A+O0=4, 
L(1A+RBH)=0UvA=A HOR, 
(24B) 4 mad +BA, 
ABE) = ARE AE, 
(A+ B)€ == 18 + B€. 


Todas estas igualdades se demuestran siguiendo un mismo método: 
se toma un vector arbitrario x y se demuestra que la aplicación 
que figura en el primer miembro transforma x en el mismo vector 
en el que lo transforma la aplicación que figura en el segundo 
miembro. Por ejemplo, 


A RBA E) = (XA NB 6) =1(x 4) BH (xd) E, 
XABH AT) Xx (AB) YH XA) = (XA) BH (AA) E, 


de donde resulta que 4(B46) =41RB + A€. 
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Todas estas leyes también se pueden deducir directamente de tas 
fórmulas correspondientes del cálculo de matrices. En efecto, existe 
una correspondencia biyectiva entre las matrices cuadradas de orden 
y las aplicaciones lineales de un espacio lineal de n dimensiones. 
Esta correspondencia posee la propiedad de transiormar la suma en 
la suma y el producto en el producto. Por esto, toda identidad 
entre matrices implica una identidad análoga entre aplicaciones li- 
neales, que es lo que se quería demostrar. 


9.3. Polinomios en aplicaciones lineales. Sea 
[(A)=0a. +2 A+... +0)p4” 
un polinomio en la variable A. La expresión 
(A) =0% 6 HUA Ad”, 


donde $ es la aplicación idéntica y 4 es una aplicación cualquiera, 
se llama valor del polinomio f(A) para ¿== 4 o simplemente polí- 
nomio en A. St la matriz de la aplicación A en un sistema de coor- 
denadas es igual a A, la matriz de la aplicación [(A) en este mismo 
sistema de coordenadas es 


F(A)=x%E+0,A+... +0, A”. 

Efectivamente, f (4) se obtiene de 4 mediante las operaciones de 
multiplicación, de multiplicación por número y de adición. De los 
resultados señalados anteriormente se ve que realizando estas mismas 
operaciones con la matriz Á se obtiene la matriz de la aplicación f (4). 

Todas las reglas de operaciones con polinomios en una 
variable tienen lugar también para los polinomios en una aplicación 
lineal. Por esto, si en alguna identidad entre polinomios en A se 
sustituye A por una aplicación lineal, se obtiene una relación verí- 
dica. Por ejemplo, de las identidades 

A—l=(A—I (A+ 1) y A+ 14 (A— 1 —24? = 2 

se obtiene realizando la sustitución 1 =.1 


AE =(A— $) A HS) y 
; (A+ SY H(4—S$Y— 24? = 26. 
En particular, la identidad 
[0Me0)=g(Yf0) 


HA) E(A) =E (A) Í (4) 


gue significa que los polinomios en una misma aplicación lineal 
siempre conmutan. 

La situación resulta diferente en el caso de polinomios en varias 
variables. Esto se debe a que en los cálculos con los polinomios se 


implica la relación 


q? 
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acepta que las variables conmutan. Por esto tenemos, por ejemplo, 
las igualdades Ap4 =4?pu, Autdp =4%u1?, etc. 

Sustituyendo en estas igualdades las variables 4 y p por unas 
aplicaciones lineales arbitrarias A y MW, obtenemos las relaciones 


ABA= APR y ABPABZ AR 


que pueden resultar falsas para determinadas aplicaciones lineales. 
Está claro que estas dificultades desaparecen, si las aplicaciones 
consideradas conmutan. Por consiguiente, en toda identidad entre 
polinomios en varias incógnitas se pueden sustituir estas incógnitas 
por aplicaciones lineales arbitrarias que conmutan, obteniéndose 
como resultado una relación verídica entre aplicaciones lineales. 

Hemos convenido en que todos los espacios que se consideran 
en este libro son de dimensión finita. Sin embargo, esto no excluye 
el hecho de que una parte de definiciones y de teoremas tenga lugar 
también para los espacios de dimensión infinita. Á título de ejemplo, 
podemos señalar las definiciones de aplicaciones lineales y de las 
operaciones con las mismas y aquellas propiedades de las aplicacio- 
nes lineales, expuestas en este parágrafo, que no están relacionadas 
con matrices. 


Ejemplos y problemas 


1. Sea L el conjunto de todos los pollnomios en A de grado «< 1. Sea Y) la 
aplicación que transforma todo polinomio f (?.) en su detivada F (A). Demuéstrese 
que £)"+1=6. Hállese la matriz de 9 en el sistema de coordenadas 1, A,..., A“. 

2. Sea € el espacio de dimensión infinita de todos los polinomios en A. 1n- 
diquemos por %) la operación de diferenciación y por £ la operación de multi- 
plicación de po Inoanos por 4. Demuéstrese que ambas operaciones son lineales 
y que están ligadas por las relaciones 


Er D=2D8"=n86"-=" (a=1, 2, ...). 


3. ¿Por que no se puede considerar la aplicación $8, indicada en el problema 
anterior, en el espacio de polinomios de grado no mayor de n 

4. Las aplicaciones lineales de un espacio Y forman, respecto a las operacio- 
nes de adición y dc multiplicación por número, un espacio lineal. ¿Cuál es la 
dimensión de este espacio, si la dimensión de L es igual a n? 


$ 10. Rango y defecto de una aplicación lineal 


Hasta el momento hemos considerado aquellas propiedades de las 
aplicaciones lineales que se refieren principalmente a las reglas de 
las operaciones con las mismas. Estudiemos ahora algunas propie- 
dades de carácter más bien geométrico. 


10.1. Núcleo y dominio de valores. Sea Mi un conjunto de vec- 
tores de un espacio lineal Y y sea 4 una aplicación lineal cual- 
quiera del último. Todo vector a de M se transtorma por la apli- 
cación lineal 4 en un nuevo vector ax que es la imagen del 
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vector a. En general, esta imagen no pertenecerá a Vi, El conjunto 
de las imágenes de todos los vectores de Yi se llamará imagen de Mi 
respecto de .4 y se indicará por Wi.Z. Convendremos en llamar ¿¡ma- 
gen rectproca del conjunto Vi el conjunto de todos los vectores «de Y 
cuyas imágenes pertenezcan a Vi. 

TEOREMA 1. Las imágenes y las imágenes recíprocas de los subespa- 
cios lincales de un espacio Y respecto a una aplicación lineal cual- 
quiera A son también subespacios lineales. 

En efecto, sea A un subespacio lineal de €. Mostremos que Y. ¿ 
es también un subespacio lineal. Tomemos en 4 unos vectores « 
y b cualesquiera. Estos vectores son las imágenes de unos vectores x 
e y de A, es decir, a=x4 y b=yAX. Puesto que NM es un subes- 
pacio lineal, el vector ax + Py pertenece a Y cualesquiera que sean a 
y B. Por ello, el vector (ax -+ By) yl también pertenece a AA. Pero 
tenemos 


(ax + By) A == 0-x04d+B- yA =a0 +80, 


es decir, A.4 contiene el vector ae + fb y, por consiguiente, es un 
subespacio lineal. De forma análoga se demuestra también que ta 
imagen recíproca de un subespacio lineal Y es un subespacio lineal, 

Se llama núcleo de una aplicación lineal .4 el conjunto de to- 

dos los vectores de Y que se transforman por la aplicación 4 en el 
vector nulo y se llama dominic de valores de « el conjunto de las 
imágenes de todos los vectores de Y. La dimensión del dominio de 
valores se llama rango de la aplicación y la dimensión del núcleo 
se llama defecto de la aplicación. 

TEOREMA 2. La suma del rango y del defecto de una aplicación 

lineal A es igual a la dimensión del espacio X. 

Indiquemos por %5t el núcleo de la aplicación .¿ y supongamos 
ue d es la dimensión del núcleo Y. Indiguemos por r la dimensión 
el dominio de valores 24. Por definición, d y r son, respectiva- 

mente, el defecto y el rango de la aplicación ./. Tomemos en el 
dominio de valores %,f una base a,, az, ..., a, y seanb,, b.. ..., b, 
unos elementos dei espacio L que se transforman por lau aplicación .£ 
en Q,, Az -.., a, respectivamente. Los vectores b,, ba, ..., b, son 
linealmente independientes, ya que de la relación 


2 FAROE ..- 0, =0 
se deduce que 


(2,0, +%:b¿ +... +0,0,) 0 =0,0, +04 + -..+%0,=0, 
y, puesto que a,, %,, ..., a, son linealmente independientes, se tiene 
QA, 9WA¿=... =a, =0. 


Consideremos el subespacio Wi tendido sobre los vectores b,, /,, 
-.., b,. El sistema 6,, ...,b, es una base de Yi y por ello la 
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dimensión del subespacio Yi es igual a r, es decir, al rango de la 
aplicación 4. Demostremos que el espacio Y es la suma directa de 
los subespacios Vi y M. Para ello es suficiente demostrar, según el 
p. 6.2, que MANN =f0) y que L =! +9. Demostremos lo primero. 
Todo vector de M es de la forma 


b=0a,b,+0%0,+... +0,b,. 
Si b pertenece a Si, se tiene b44:=0, es decir, 
(2D,+... +40) A=0,/0,+... 40,0, == 0. 


Pero los vectores a,, ..., a, son linealmente independientes y por 
esto 1, =...=0,=0, de modo que b=0 que es lo que se quería 
demostrar. Resta probar que 2=M -+N, Tomemos un vector cual- 
quiera a de £. Su imagen ax pertenece a 2L,y4 y, por consiguiente, 
se expresa linealmente en términos de a,, ..., Q,: 


UA =04,0, +A 40H... 40,0). 
Sea 
b=a4b,+0.b.+...+0,b, y a—b=c. 
Puesto que 


bA=02, bA+...+0,-b, A=0,0,+... +0,0, =0.k, 


se tiene 
cil =(a —0) A =0ad —bal =0. 


Por consiguiente, c pertenece a MN. Es decir, tenemos 
a=b+c (bEM, CE); 
pero esto significa precisamente que 


£=M-4N. 


Como que esta suma es directa, la dimensión del espacio £ es igual 
a la suma de las dimensiones de los subespacios Wi y RM, es decir, 
es igual a la suma del rango y del defecto de la aplicación 4. 
Hemos demostrado el teorema. 

Consideremos un ejemplo. Sea N el espacio corriente de los seg- 
mentos orientados que parten de un punto O. Tomemos un plano 
cualquiera Y que pase por el punto O e indiquemos por FP la ope- 
ración de proyección ortogonal sobre YB. La aplicación P transforma 
todo el espacio M en el plano B. Es decir, $ es el dominio de va- 
lores de la aplicación P y el rango de $ es igual a 2. El núcleo 
de la aplicación P está compuesto por los vectores que pertenecen 
a la recta que pasa por el punto O y que es perpendicular al 
plano Y, ya que solamente estos vectores son transíormados por la 
aplicación F en el nulo. Por consiguiente el defecto de P es igual 
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a 1. La suma del tango y del defecto de la aplicación FP es igual 
a 3 tal y como debe ser según el teorema 2. 


10.2. Aplicaciones singulares y regulares. Más arriba (en el 


p. 9.1) hemos señalado que no toda aplicación es invertible. En lc 
sucesivo las aplicaciones lineales invertibles serán llamadas regulares, 
mientras que las aplicaciones no invertibles se llamarán singufares. 
En el p. 9.1 hemos encontrado en forma matricial las condiciones 
que garantizan que una aplicación lineal sea regular. Queremos dar 
ahora a estas condiciones un carácter geométrico. 


TEOREMA 3. Para que una aplicación lineal A de un espacio £ 
sea regular es necesario y suficiente que el núcleo de esta aplicación 
sea nulo, es decir, que el defecto de A sea igual a cero. 


DEMOSTRACION. Si la aplicación dada 4 es regular, todo vector 
debe tener sólo una imagen recíproca; en particular, sólo una ima- 
gen recíproca debe tener el vector nulo o. Puesto que o siempre es 
una imagen reciproca del vector nulo y puesto que en este caso el 
núcleo está compuesto sólo de un vector, éste será precisamente el 
vector 0. 

Viceversa, sea el defecto de 4 igual a cero. En virtud del teo- 
rema 2, de aquí se deduce que el rango de 4 cs igual a la dimen- 
sión de £, es decir, que la dimensión del dominio de valores 
£4 es igual a la dimensión de €. Por consiguiente, LA = Y; vemos, 
pues, que todo vector de £ es la imagen de un vector de L. Si de- 
mostramos que la aplicación 4 transíorma diferentes vectores a y b 
en diferentes vectores, esto significará precisamente que la aplica- 
ción 4 es invertible (p. 7.3). Pero de aA=b4 se deduce que 
(a—b) A =0. Puesto que, por hipótesis, el núcleo de 4 es nulo, 
tenemos a—b=o0, es decir, 4== b que es lo que se necesitaba. Hemos 
demostrado el teorema. 

La igualdad a cero del defecto de 4 equivale a la coincidencia 
del rango de 4 y de la dimensión del espacio *. Por ello, el teo- 
rema 3 puede ser enunciado también en la forma siguiente: 

TEOREMA 4. Para que una aplicación lineal A de un espacio Y 
sea regular es necesario y suficiente que el dominio de valores de uv 
coincida con Y, es dectr, que e! rango de 4 sea igual a la dimen- 
sión de 2. 

Una aplicación biyectiva de un espacio lineal sobre otro se de- 
nomina isomorfismo, si transforma una suma de vectores del primer 
espacio en la suma de los vectores correspondientes del segundo 
espacio y si transíorma, además, el producto de un número por un 
vector del primer espacio en el producto del mismo número por el 
vector correspondiente del segundo espacio (p. 4.3). Si ambos espa- 
cios lineales coinciden, obtenemos una aplicación isomorfa de un 
espacio lineal sobre si mismo. Toda aplicación de este tipo se llama 
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automorfismo de un espacio lineal. La definición de automorfismo 
coincide, obviamente, con la definición de una aplicación lineal 
regular. Por consiguiente, las aplicaciones lineales regulares de un 
espacio € pueden ser consideradas como automorfismos de este espa- 
cio. De la definición misma de automorfismo resulta que los auto- 
morfismos de un espacio * son aquellas superposiciones del espa- 
cjo Y sobre sí mismo que conservan todas sus propiedades geométricas, 
es decir, las propiedades que se enuncian en términos de las opera- 
ciones de adición y de multiplicación por número. 

Consideremos dos aplicaciones lineales arbitrarias 4 y A de un 
espacio *. Convendremos en llamar estas aplicaciones ¿somorfas O 
semejantes, si existe un automorfismo $8 del espacio Y que transfor- 
ma una aplicación en la otra. 

Sea u un vector de € y sea v=u4A. El automorfismo 8 trans- 
forma u en un vector x y vu en un vector y. S= dice que 8 trans- 
forma la aplicación 4 en B, si xB=y (véase la fig. 3). Puesto 
que x=u8 e y=u8, de la igualdad x3 «y resulta 


uEB=VE y UEBÉ 7! =0=UA. 


EBETI=A y B= "AE. (1) 


Por consiguiente, una aplicación B es isomorfa a una aplicación A 
si, y sólo sí, se obtiene transformando «1 por un automorfismo del 
espacio £, es decir, por una aplicación regular de este espacio. 

Tomemos en Y un sistema de coordenadas y sean A, B y C 
las matrices respectivas de las aplicaciones 4, 3 y 8. Entonces 
la igualdad (1) equivale a la relación matricial 


B=C-AC 


y llegamos a la siguiente conclusión: para que dos aplicaciones li- 
neales de un espacio € sean isomorfas es necesario y suficiente que sus 
matrices sean semejantes. 

Debemos considerar las aplicaciones isomorfas como aplicaciones 
que tienen las mismas propiedades geométricas. De aquí la impor- 
tancia de saber clasificar, salvo un isomorfismo, todas las aplica- 
ciones lineales. Algebraicamente este problema equivale a la clasi- 
ficación, salvo semejanza, de todas las matrices cuadradas de orden n. 
E] problema de clasificación de todos los espacios lineales sobre 
un cuerpo dado se resuelve sin dificultad (véase el p. 4.3); en 
cambio, el problema de la clasificación de las aplicaciones tineales 
exige para su resolución un estudio más detallado de las propieda- 
des de las aplicaciones lineales. Este problema quedará totalmente 
resuetto sólo en el capitulo siguiente. 

Señalemos, para concluir, una propiedad más de las aplicaciones 
lineales isomorfas: para que las aplicaciones lineales ul y YH sean 
isomorfas es necesario y suficiente que existan unos sistemas de coor- 


De aquí 
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denadas en los que estas aplicaciones se representen por una misma 
matriz. 

En efecto, si 4 y 3 son isomorfas, sus matrices están ligadas 
por la retación A=CBC”!. Pero esta retación muestra que, si pa- 
samos del sistema de coordenadas dado a otro de manera que la 
matriz del cambio sea C, la matriz de la aplicación AH en el nuevo 
sistema de coordenadas será A, es decir, coincidirá con la matriz 
de ta aplicación 4 calculada en el sistema antiguo de coordenadas. 
Viceversa, sí la matriz A de la aplicación yl en el sistema de coor- 
denadas 4,, ..., 4, Coincide con la matriz de la aplicación 3 cal- 
culada en el sistema de coordenadas a;,, ..., 4, y si C es la matriz 
del cambio del primer sistema de coordenadas por el segundo, ten- 
dremos que las matrices de las aplicaciones 4 y %W en el segundo 
sistema de coordenadas serán iguales, respectivamente, a CAC”! 
y a 4, es decir, serán semejantes, que es lo que se quería demostrar. 


10,3. Rango de la matriz de una aplicación. En el p. 10.! 
hemos introducido el concepto del rango de una aplicación lineal. 
Por otro lado, conocemos del p. 5.2 el concepto del rango de una 
matriz que es el número máximo de sus filas linealmente inde- 
pendientes. Surge el problema sobre la relación que existe entre 
estos conceptos. La respuesta viene dada por el teorema siguiente: 

TEOREMA 5. El rango de una aplicación lineal cualquiera A de 
un espacio Y coincide con el rango de la matriz de esta aplicación. 

Sea a,, ..., a, un sistema de coordenadas de *. El dominio 
de valores de la aplicación 4 esta compuesto por las imágenes de 
los vectores del espacio *, es decir, por vectores de tipo 


(4,8, -)- 1,4, + ... + A) A += A; (a, A) + Ay (ayu) + eee + ln (Anut). 


De aquí se desprende que el dominio de valores de la aplicación 
A es el subespacio tendido sobre los vectores a,4A, .... Opt. 
-El rango de «í es igual a la dimensión del dominio de valores y, 
por consiguiente, al número máximo de vectores linealmente inde- 
pendientes entre los vectores a,4, ..., 4,4 (p. 6.1). Sea 


Qué =0A,Q, FA RH. O, 
At = A, 11 $ Agyla E o. FOO. 
Qhil = 2,0, + An la HH. + O ll. 

La matriz 

Ay Ay «App | 

ii O a 

A pa 21 22 2 


Cm At a Gan 


es la matriz de la aplicación 4. Las filas de esta matriz son las 


138 Cap. f!!. Aplicaciones lineales 


filas de coordenadas de los vectores 4,4, ..., GA. Luego, el nú- 
mero máximo de vectores linealmente independientes entre los 
vectores Qjut, ..., At €s igual al número máximo de filas lineal- 
mente independientes de la matriz A, es decir, es igual a su rango 
que es lo que se quería demostrar. 

Se llama defecto de una matriz cuadrada la diferencia entre su 
orden y su rango. De los teoremas 2 y 5 se desprende directamente 
que el defecto de una aplicación lineal es igual al defecto de su matriz. 


Consideremos a título de ejemplo un sistema de n ecuaciones lineales homo- 
£éneas 


211 + 520 <-> + “Ena =0, 
E %:2 FE +. + En 22 0, (2) 


A A A 


con a incógnitas 1. En, ..., E . Queremos estudiar las soluciones de este siste. 
ma. Geométricamente este problema puede ser interpretado de la forma siguiente. 
Tomemos un espacio linea] cuaiquiera € de n dimensiones y escofamos en él un 
sistema de coordenadas 2,, ..., Az. Convengamos cn Interpretar las magnitudes 
incógnitas Ez, ..., En como las ccordenadas de un vector x de £. Consideremos 
la aplicación lincal 4 de este espacio cuya matriz A está compuesta por los 
clementos «yy (í, j==1, 2, ..., n). El sistema de ecuaciones (2) puede ser re- 
presentado en la forma 


(xJA=0 
xÁA =0. 


De aquí se ve que las soluciones del sistema (2) son las fllas de coordenada 
de los vectores pertenecientes ol núcleo de la aplicación 4. Puesto que la di- 
mensión del núcleo colncide con el defecto de la aplicación y el defecto de la 
aplicación es igual al defecto de su matriz, llegamos al conocido teorema de Ja 
tcoría de los determinantos: el número máximo de soluciones linealmente indepen- 
dientes de un sistema homogéneo de n ecuaciones lineales con n incógnitas es igual 
al defecto de la matriz de este sistemu. 


o cn la forma vectorial 


Ejemplos y problemas 
; J. En el espacio de filas de longitud 4 se ha tomado el sistema de coorde- 
nadas 
e,=[(), 0, 0, 0), es =[0, 1, 0, 0], €sz=1[0, 0, 1, 0] y e,==[0, 0, O, 1]. 


Háltense el núcleo y el dominlo de valores de las aplicaciones lineales definidas 
por las matrices 


2 2100 31 1.3 51 

0 210 2 1 2 1.31 
3 |: 20|: 00 |Yj4 7133|l: 
0 0 00 3=1 11 


2. Sea A una aplicación lineal de un espacio Y y sea DM un subespacio 
lineal de €. Demuéstrese que la dimensión de la imagen del subespacio Wi sa- 
tisface las desigualdades 


dim. M— def. y < dim. VIA < dim. TM. 
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3. Si yl, y A¡, son unas aplicaciones lineales arblitrarin y regular, respec- 
tivamente, se ticne 
rango (Hide) = rango (uf.:l,) rango yy. 
4. Scan «ly y «l¿ unas aplicaciones lineales cualesquiera de un espacio li- 
neal Y. Entonces se tiene 
rango (A1 +A) < rango yl, + tango ula, 
del. (Mit) <del. Ay +del. do, 
rango (4,42) < rango yl, y rango (ul1l2) < rango ul. 
5. Toda aplicación lineal de rango 1 puede ser representada en forma de 
una suma de aplicaciones de rango 1. 
6. Paro que una matriz A de orden n tenga el rango no mayor que | es 
necesario y suficiente que A pueda ser representada en la forma 
a: 


Uy 


A = (P1P¿- Ba) =11%:8, 11, 


Un 
donde a; y f, son números determinados. 


$ 11. Subespacios invariantes 


11.1. Aplicación inducida. Se dice que un subespacio Y de 


un espacio lineal Y es Invariante respecto a una aplicación y si todo 
vector de Y se transforma por la aplicación .4 de nuevo en un 
vector de %l, es decir, si 
dos A 

De esta definición se desprende directamente que los subespacios 
impropios (el subespacio nulo y el propio espacio Y) son invarian- 
tes respecto a cualquier aplicación lineal. También directamente 
se deduce la proposición de que toda suma y toda intersección de 
subespacios invariantes es de nuevo un subespacio invariante. 

Observemos además que siendo un subespacio U invariante res- 
pecto a una aplicación A, YU también será invariante respecto a 
la aplicación f(.t), donde [(A)=%.8 +0 d+... Fat” es un 
polinomio arbitrario en «A. 

En efecto, si a es un vector de A, el vector ad! está contenido, 
por hipótesis, en YA. De aquí se deduce que (a.4) 4=ad? está 
contenido en YA, etc. Vemos, por consiguiente, que el vector a4* 
pertenece a Y cualquiera que sea kR>>0. Pero en este caso A con- 
tiene también todas las combinaciones lineales de estos vectores; 
en particular, Y contiene el vector 


Af (1)=0,0+0,'Ad +... +A ad”, 


que es lo que se quería demostrar. 
Los métodos de determinación de los subespacios invariantes 
serán considerados en el p. 11.4 y en el $ 12; ahora, queremos 
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sólo explicar cómo se pueden aprovechar los subespacios invarian- 
tes para simplificar la matriz de una aplicación. 

Sea Y un subespacio invariante no trivial de una aplicación 
lineal «¿. Tomemos en Y una base a,, 4,, ..-, 4, complementán- 
dola con vectores linealmente independientes 4...» --., €, hasta 
obtener una base de todo el espacio Y. Para hallar la matriz de 
la aplicación Y4 en el sistema de coordenadas 2,, ..., Gm Gmn+ro 

, , 4, es necesario expresar linealmente los vectores 4,4, ..., q, A 
en términos de Jos vectores coordenados a,, ..., 4,. Pero el subes- 
pacio Y es invariante y, por ello, los vectores a,4, ..., Opel 
pertencen de nuevo a A y se expresan linealmente en términos 
de Q,, ..-, 4. Por consiguiente, tenemos 


a A =04,0, +... FG: md 
Apt =ar tl, +... +FO2malm. (1) 
Amr A = Um+t. 12, + ... «)- ZXMa+t, mÚ mn | ... +An+t, nO» 


QA = Al, -h e... +3 Arm? mn + ... - Annd nm» 


es decir, la matriz de la aplicación 4 es igual a 


Ss N Sa Amy 0 ...o 0 
TS A A 0 as 20 m A,0 
dá Ctra? Amr Amro ms +: nr = [5 A, " (2) 
L_ Any a mr 


Resumiendo, si una aplicación lineal posee un subespacio lineal 
invariante, su matriz en un sistema de coordenadas adecuado se 
descompone en cuatro células con la particularidad de que las célu- 
las diagonales son cuadradas, mientras que la célula superior de 
la derecha puede resultar rectangular, pero formada integramente 
por ceros. Las matrices de este tipo han sido llamadas en el p. 2,1 
semidescompuestas. Reciprocamente, si en un sistema de coordenadas 
la matriz de una aplicación lineal 4 tiene la forma semidescom- 
puesta (2), las igualdades (1) muestran que en este caso el subes- 
pacio Y tendido scbre los m primeros vectores coordenados será 
invariante respecto de .¿. 
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Geométricamente la matriz A, puede ser interpretada de modo 
siguiente. Tememos que la aplicación 4 transforma todo vector 
de A de nuevo en un vector de %Y. Por esto ¿1 puede ser conside. 
rada también como una aplicación del espacio A. Indiquemos esta 
aplicación por 4, y convengamos en llamar 4, aplicación inducida. 
Las aplicaciones A y 4, actúan sobre los vectores del subespacio 
% idénticamente: si a es un vector de Al, se tiene ax =4a4,. La 
diferencia entre estas aplicaciones consiste en que tienen distintos 
campos de definición: si a es un vector del espacio principal Y 
que no pertenece a A, la operación ax tiene sentido, mientras 
que at, no lo tiene. 

Las primeras m igualdades del sistema (1) muestran que A, es 
la matriz de la aplicación inducida 4, en el sistema de coordena- 
das 4,, Qy, .-., Gp 


11.2. Suma directa de subespacios invariantes. Hemos conside- 


rado el caso en que la aplicación lineal 4 tiene sólo un subespacio 
invariante. Supongamos ahora que A posee dos SUBES paciÓS inva- 
riantes A, y Al, y, es más, supongamos que el espacio £ es la suma 
directa de estos subespacios. Tomemos en A, y A, unos sistemas 
de coordenadas Q,, -..., Gn Y Qn+j» -- -» An. respectivamente. Según 
el p. 6.2, los vectores a,, ..., Gm, Gary» +» +» A, forman un sistema 
de crrordenadas de *. Veamos la forma que toma en este sistema la 
matriz de la aplicación 4. Por hipótesis, los vectores a, 4, ..., AA 
pertenecen a 07] y los vectores Qa,, A, ..., Apt pertenecen a A,. 
Luego, tenemos 


QÁ=0/10, +... + QG%mGy 


UgÁ UE ls (3) 
Up, A = Urra ++ LH in Ono | 


ap Á = Ca mina Yo ++ Rp p> 


Por consiguiente, la matriz de la aplicación .f resulta ser igual a 


EA sa. Y 
mn ..* On 0 o. 0 A, O 
A= pro 0 Om+riiom+r oo: Amia lo (4) 


A E A 
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es decir, resulta ser descompuesta. Sean 4, y A, las aplicaciones 
inducidas en los subespacios Y, y YA, por la aplicación 4. De las 
igualdades (3) se deduce que A, y A, son las matrices de las apli- 
caciones 4, y A, en los sistemas correspondientes de coordenadas. 

Resumiendo, si un espacio Y se descompone en una suma directa 
de subespacios invariantes respecto a una aplicación lineal 41, la 
matriz de la aplicación 4 calculada en un sistema adecuado de coor- 
denadas toma la forma celular diagonal y sus células diagonales 
representan las matrices de las aplicaciones inducidas por la aplica- 
ción A en los subespacios invariantes. 

Hemos demostrado esta proposición sólo en el caso de una suma 
de dos subespacios invariantes. Sin embargo, todos los razonamien- 
tos se traspasan sin modificaciones al caso de un número arbitrario 
de sumandos. 

Supongamos ahora lo contrario aceptando que en un sistema de 
coordenadas la matriz de la aplicación 4 toma la forma descom- 
puesta (4). Entonces de las igualdades (3) se desprende que el espa- 
cio A, tendido sobre los m primeros vectores coordenados y el 
espacio A, tendido sobre Jos restantes vectores coordenados serán 
invariantes respecto de 4. Es obvio que la suma A, +A, es directa 
y coincide con *. Por consiguiente, la condición de que la matriz 
de la aplicación 4 se reduce a la forma celular diagonal, además 
de ser necesaria, es también suficiente para que £* sea la suma di- 
recta de los subespacios invariantes respecto de A. 

Examinemos el problema siguiente. Se tiene una descomposición 
de un espacio £ en la suma directa de unos subespacios lineales 


L=A,+%,+... +A, 
y en cada subespacio %, se tiene una aplicación lineal 4,. ¿Existe 
una aplicación lineal 4 del espacio Y respecto a la cual todos los 
subespacios Al; son invariantes y que induce en todo YA, la aplica- 
ción A¡? ¿Será esta aplicación única? La respuesta es, obviamente, 
afirmativa. En efecto, tomemos en cada uno de los subespacios Y, 
una base 4;,, Gps ..., Gm, € indiquemos por AÁ;, la matriz de la 


aplicación 4, en este sistema de coordenadas. Consideremos la ma- 
triz celular diagonal 


ASA, +4,+ ...+4As. 


El sistema formado por los vectores Q,,, ..., Qjm» -»»» Ano ---» Cam, 
es una base del espacio *. En esta base a la matriz A le corres- 
ponde una aplicación lineal 4 del espacio £. En virtud de lo 
expuesto anteriormente, la aplicación 4 satisface todas las condi- 
ciones de nuestro problema. Esta aplicación es unica, ya que su 
matriz en el sistema de coordenadas indicado se «termina unívo- 
camente por las condiciones del problema. 
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11.3. Polinomio característico de una aplicación. En este punto, 
así como en el siguiente, sesupone que el cuerpo principal es un cuer- 
po conmutativo. Tomemos una aplicación lineal cualquiera 4 de 
un espacio lineal Y de n dimensiones. Escogiendo en Y un sistema 
de coordenadas determinado a,, ..., 4, podemos calcular la matriz 
A de la aplicación 4. El polinomio característico p(A) =]4£ —A] 
de la matriz A se llama polinomio característico de la aplicación A. 
Si tomamos otro sistema de coordenadas a;, ..., a, e indicamos 
por T la matriz del cambio, la matriz de la aplicación 4 en el 
pd sistema de coordenadas será, de acuerdo con el p. 8.3, la 
matriz 


A,=TAT-*, 


es decir, la matriz semejante de A. Sin embargo, en el p. 3.2 he- 
mos demostrado que las matrices semejantes tienen los mismos po- 
linomios característicos. Por consiguiente, el polinomio característico 
de una aplicación A no depende del sistema de coordenadas en el que 
se calcula. 

El grado del polinomio característico es igual al orden de ta 
matriz A y el orden de la matriz A es igual a Ja dimensión del 
espacio Y. Por esto, el grado del polinomio característico de una 
aplicación. A es igual a la dimensión del espacio en el que actúa 
esta aplicación. 

La suma de las raíces del polinomio característico es igual a la 
traza y el producto de las raíces es igual al determinante de la 
matriz A. Puesto que el polinomio característico de 4 y, por con- 
siguiente, también sus raíces no dependen del sistema de coorde- 
nadas, tampoco la traza y el determinante de A dependerán del 
sistema de coordenadas. Por esta razón la traza y el determinante 
de la matriz de una aplicación A se llaman traza y:determinante de 
ta aplicación A. 

Si el espacio L se descompone en una suma directa de los 
subespacios Y, y A, invariantes respecto de 4, la matriz de la 
aplicación 4 toma, en un sistema de coordenadas adecuado, la forma 


celular diagonal 
A, ,) 
A= 
al 


Según el p. 3.3. el polinomio característico de la matriz A es igual 
en este caso al producto de los polinomios característicos de las 
matrices A, y A,. Pero A, y A, son las matrices de las aplicacio- 
nes lineales inducidas por la aplicación 4 en los subespacios inva- 
riantes A, y A,. Por lo tanto, si un espacio Y se descompone en la 
suma directa de subespacios invariantes respecto a una aplicación 
lineal A, el polinomio característico de la aplicación A es igual al 
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producto de los polinomios característicos de las aplicaciones inducidas 
por la aplicación 1 en los subespacios invariantes, 

Según el teorema de Hamilton—Cayley (p. 3.2), toda matriz 
cuadrada Á es raíz de su polinomio característico «p(A), es decir, 
p(4)=0. Sea 4 una aplicación lineal de matriz A. La matriz de 
la aplicación p(4) es, de acuerdo con el p. 9.3, p(4). Como que 
esta matriz es nula, tenemos p (4) =6. Por consiguiente, toda apli- 
cación lineal es ralz de su polinomio característico. 

Se lama polinomio mínimo de una aplicación lineal A el poli- 
nomio de menor grado de coeficiente principal igual a 1 para el 
gue la aplicación 4 es una raíz. Sea A la matriz de la aplicación 
«¿ calculada en un sistema de coordenadas. Puesto que las relacio- 
nes f(A)=0 y f(4)=6, donde f(A) es un polinomio arbitrario, 
son equivalentes, resulta que el polinomio minimo de una aplicación 
coincide con el polinomio minimo de la matriz de esta aplicación. 

Si el espacio £ se descompone en suma directa de subespacios 
invariantes respecto a una aplicación 4, la matriz de la aplicación 
«/, en un sistema de coordenadas adecuado, se descompone. El poli- 
nomio mínimo de una matriz descompuesta es el mínimo común 
múltiplo de los polinomios minimos de sus células diagonales (p. 3.3). 
Por esto, el polinomio mínimo de una aplicación 4 será igual al 
mínimo común múltiplo de los polinomios minimos de las aplica- 
ciones inducidas por la aplicación «4 en los subespacios invariantes. 


11.4. Vectores propios y valores propios. Continuemos suponiendo 
que el cuerpo principal es un cuerpo conmutativo. Queremos ahora 
estudiar más detalladamente los subespacios invariantes de una di- 
mensión. Introduzcarnos primero la definición siguiente. Un número E 
se llama valor propio de una aplicación lineal 4, si existe en el 
espacio Y un vector no nulo a, tal que 


alt = La. (5) 


Todo vector que satisface esta relación se llama vector propio de la 
aplicación A correspondiente al valor propio £. 

La búsqueda de los vectores propios y la búsqueda de los subespacios 
invariantes de una dimensión son problemas equivalentes. Efectiva- 
mente, sea a un vector no nulo propio de una aplicación 4 y sea £ 
su valor propio correspondiente. Consideremos el subespacio de una 
dimensión YU tendido sobre el vector a, es decir, el conjunto de todos 
los vectores de tipo aa. La relación 


(a20) 1 =a (04) = La a (6) 


muestra que M es invariante respecto de 4. Recipraecamente, sea A 
un subespacio de dimensión uno invariante respecto de 4. Tome- 
mos en A un vector arbitrario no nulo a. Puesto que A es de una 
diniensión, todos los vectores de Y son de la forma aa. Por hipó- 
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tosis, ax pertenece a Y; Juego, 
ad =50, 

es decir, a es un vector propio de la aplicación yl correspondiente 
al valor propio £. La igualdad (6) muestra que todos los demás 
vectores de Y también son vectores propios correspondientes al va- 
lor propio £. 

Escojamos en el espacio Y un sistema de cuordenadas Q,. ..., 4, 
y sea A=|pa;,]] la matriz de una aplicación lineal «£ en este sis- 
tema. Indiquemos por a algún vector propio no nulo de la aplica- 
ción «4. Sea [E,, Es. ..., E,] la fila de coordenadas del vector « y 


sea E el valor propio correspondiente. Pasando en la igualdad (5) 
a las coordenadas, obtenemos 


(a) A=; [a], 17) 


5%: +E,%21 mel Ena =€5., 
EQ FEA + + HE > Gs» 


.» . . o (8) 
Ein Fan + ++ EE = SE. 
Pasando todos los términos a un misimo miembro, obtenemos 
Er (E — 11) — Er + —En 2%, =0, | 
A (o 
—E1% 9 —Esn— > ++ En (E — An) = 0. 


Este sistema puede ser considerado como un sistema de n ecuacio- 
nes lineales homogéneas con 1 incógnitas E,, E,, .... En. Puesto que 
las coordenadas del vector no nulo propio a satisfacen el sistema (9), 
tenemos (véase el p. 10.3) 


EA — O. —On 
—Oar Cr... — 
ey 5 22 Kan =|E—A|=0, (10) 
— 1 — Aug .... ¡a — On 


donde E es la matriz unidad. Pero |AE— A] es el polinomio curac- 
terístico de la matriz A; por ello, de la iguatdad (10) se desprende 
que todos los valores propios de una aplicación lireal son raices de 
su polinomio característico. Reciprocamente, si l es ura raíz del pu- 
linomio característico de una aplicación 4 que perlenece al cuerpo 
conmutativo de coeficientes del espacio lineal, resulta que € es un vu- 
tor propio de la aplicación 4. En electo, la igualdad (10) muestra 
que el rango de ta matriz del sistema (9) será menor que 1; por 


10—1843 
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consiguiente, este sistema tendrá al menos una solución no nula. 
Indicando esta solución por [E,, Es, -... €,)], obtenemos directa- 
mente de (8) y de (7) que el vector a de coordenadas E,, E,, ..., Es 
será el vector propio no nulo deseado”. 

Se llama multiplicidad de un valor propio € de una aplicación 
lineal 4 la multiplicidad que tiene [ como raíz del polinomio ca- 
racterístico de la aplicación A. 

Consideremos un ejemplo. Supongamos que en el espacio lineal 
real de tres dimensiones de base a,, a, y a, actúa una aplicación 


lineal 4 de matriz 
3 3 2 
a=| 1 1 —2]. 
—3 —1 0 


Se necesita hallar los valores propios y los vectores propios de la 
aplicación 4. Calculamos, ante todo, el polinomio característico de 
la aplicación A: 


= —3 —2 


—1 A—1 2| 000040 
3 1 4 


Sus raíces son iguales a 4,=4, A,==21 y A, =-—2!. Puesto que el 
cuerpo principal es real, los dos últimos valores deben ser omitidos, 
mientras que el primer valor A,+=4 será el valor propio buscado. 
Para hallar los vectores propios formamos el sistema (9) que, en 
nuestro caso, se convierte en . 


E —E, +-3E, = (0, 
—3E, + 3É, +8, =0, 
—2E, +2, +45, =0. 


Resolviendo este sistema obtenemos 
Es =É5, y E, >0, 


donde E, es arbitrario. Por consiguiente, el vector E,a, +E,a, será 


un vector propio de la aplicación 4 cualquiera que sea E,. 


1) Existe una demostración más breve de la última proposición. La condi- 
ción aA=(a puede ser representada en la forma a (E 4 — A) ao. Esto demuestra 
que los vectores promos de 4 son vectores que pertenecen al núcleo de la apll- 
cación [4 — A. Pero, para que el núcleo contenga vectores no nulos es necesa- 
rio y suficiente que la aplicación sea singular (p. 10.2), es decir, es necesario 
y suficiente que sea JEE— A[=0. 
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2 


Ejemplos y problemas 


l. En un espacio complejo € de base a,, 2y, Ga y G, está definida una 
aplicación YX de matriz 
ES 
l 4 
A=l3_1 0 1 
l —] 


¡2 — 2 


Hállense los vectores propios y los valores propios de la aplicación 4. Demuéstre- 
se que el subespacio tendido sobre los vectores 22, —ay. y —a¿+a4, es invariante 
respecto de Y 

2. Supongamos que un espacio ( tlene una base formada por los vectores 
propios de una aplicación 4. ¿Cuál será la matriz de la aplicación A en esta 
ase 

3. Si en un espacio Y con un sistema de coordenadas a,, %y, ..., Ga la 
matriz de una aplicación lineal 4 es de forma celular semidescompuesta 


Ar B 
a=[9 43). 
donde Ay es una matriz cuadrada de orden m, el subespacio tendido sobre los m 
últimos vectores coordenados az-at+1 -... Gn Será invariante respecto de 4. 


4. Sí la aplicación Y es regular, todo "subespacio invariante respecto de 4 
también será invarlante respecto de 4”!. 


5. Sí un subespacio Y es invariante respecto a una aplicación lineal 4, la 


imagen y la imagen recíproca del subespacio Y también serán invariantes res- 
pecto de 4 


6. En un espacio lineal complejo toda aplicación lineal tiene al menos un 
vector propio no nulo. 

7. Supongamos que en un sistema de coordenadas a,, ..., 4, la matriz de 
una aplicación 4 es de forma diagonal con diferentes elementos diagonales. 
Hállense todos los subespacios Invariantes de la aplicación 4 y demuéstrese 
que el número de los mismos es Igual a 2%, 

8. Sí una aplicación lincal ,4 de un espacio € de n dimenslones tiene n 
valores proplos diferentes, la matriz de ta aplicación 4 se reduce, en un sistema 
de coordenadas adecuado, a la forma diagonal. 


$ 12. Aplicaciones de matrices de forma normal 


En este parágrafo serán examinadas las propiedades de las 
aplicaciones lineales, cuyas matrices tienen, en un sistema de coor- 
denadas fijo, la así llamada forma normal de Jordan. Por consi- 
guiente, supondremos de antemano que las matrices de las aplicaciones 
consideradas pueden ser reducidas a esta forma. Más adelante, en 
el p. 15.4, veremos que esta reducción es siempre posible en el 
cuerpo de los números complejos. 

n todo este parágralío se supone que el cuerpo principal es 
un cuerpo conmutativo, 


12.1. Forma diagonal. El teorema que sigue ofrece la caracte- 


rística más simple de las aplicaciones, cuyas matrices pueden ser 
reducidas a la forma diagonal. 


LS 
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TTroremy 1 Si una aplicación lineal de un espacio de n dimen- 
siones tiene n vectores propivs linealimente independientes, entonces 
tomindolos como ucctores cuordenados reduciremos la matriz de la 
aplivación a ta forma diagonal. Reciprocamente, si la matriz de una 
aplicación en un sistema de coordenadas es de forma diagonal, los 
tevtores de la base son vectores propios de la aplicación. 

La demostración es evidente. Un problema más sutil consiste 
en averiguar, a parlir de la matriz de una aplicación calculada en 
un sistema de coordenadas eventual, si la aplicación posee vectores 
propios que constituyan una base del espacio. Este problema quedará 
resuelto en el p. 15.4, mientras que ahora estudiaremos sólo un caso 
particular del mismo. 

TEOREMA 2 Los vectores propios correspondientes a diferentes va- 
lores propios de una aplicación lineal son linealmente independientes. 

En efecto, sean P,, Pz» ---» Pa distintos valores propios y sean 
Qi, Aa...» Opa Jos vectores propios que jes corresponden de una 
aplicación lineal 4. Por inducción, podemos aceptar que a,, ..., Gm.) 
son linealmente independientes. Supongamos que 4,, ..., Q, están 
ligados por una relación 


AA+... FO Y An = 0- 


Aplicando a ambos miembros de esta igualdad la aplicación .«£, 
obtenemos 


E E AA PE A PA 
Eliminando a,,, tendremos 
MO TI E pl AR 11 —Pa-=1) 41 30. 


Debido a la independencia lineal de a,, ...,€,., de aquí resulta 
4)=...=G%p.,=0 y, por consiguiente, a, =0 que es lo que se 
quería demostrar. 

Comparando ambos teoremas demostrados, obtenemos el corolario 
siguiente: si el polinomio característico de una aplicación lineal de 
un espacio de n dimensiones fiene n diferentes raices, la matriz de 
la aplicación se reduce, en un sistema de coordenadas adecuado, a la 
forma diagonal. 

Por ejemplo, el polinomio característico de la matriz 


Mi 31 21 


—]11 3 
L — 2 


tiene las raíces += 1, +2; las filas de coordenadas de los vectores 
propios correspondientés son (2, 3, — 5, — 4), (0, 3, — 1, 4], 
[0, O, 4, 5] y [0O, 0, O, 1). Tomándolos como vectores coordenados 
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reduciremos la matriz A a da forma diagonal con los número» 1, 
—1, 2 y —2 a lo largo de la diagonal principal. 


32.2. Células de Jordan. Una matriz de tipo 


p 10... 07 
p1... 0 
al (m 
p 1 
L P 


se llama célula de Jordan. El polinomio característico de una célula 
de Jordan es igual a (A—p)”, donde n es el orden de la matriz. 
Por consiguiente, p es su único valor propio de multiplicidad ». 

Sea Y un espacio lineal de base e,, €,, ..., €, y sea 4 una 
aplicación lineal que en esta base tiene una matriz A de tipo (1). 
En este caso tenemos 


e A =P0, Ha...) lao e = Pl 1 Has ll = Pla (2) 
y, por consiguiente, 
e, (A—pP8$) =€2 e, (A—P$Y Cp, -..». e, (A —p6Y"! =e,. (3) 


Puesto que 4 debe ser una raíz de su polinomio característico, 
se tiene (4 —p8$) =6. El polinomio mínimo de la aplicación .7 
divide su polinomio característico y, por ello, debe ser de la forma 
AP", 0O<SsSEn. La última de las igualdades (3) muestra que 
(4—p8)"7? +6, de manera que s=+*, es decir, el polinomio minimo 
de una célula de Jordan coincide con su polinomio caracteristivo 
Ap)”. 

Indiquemos por *, el subespacio tendido sobre los vectores e,, 
€j4po ..., ln (i=1, 2, ..., n) de la base. De las igualdades (2) y 
de la forma de la matriz A se deduce que todos estos subespacios 
son invariantes. Empleando las relaciones (3) es fácil comprobar que 
Y, está compuesto por aquellos vectores, y sólo aquéllos, x para los 
cuales se tiene 


X (.l —póyt+ =0. 


Esto demuestra que la cadena de subespacios Y*=*%,>%>... 
.. «3,0 no depende de la selección del sistema de coordenadas 
y está definida por la propia aplicación A. 

Demostremos que la aplicación no tiene otros subespacios invurian- 
tes. En efecto, sea Vi un subespacio invariante de y diferente de Y,. 
Busquemos un índice í tal que Vi, y M H2,_,, aceptando, para 
generalizar, que Y,.,=0. Mostremos que Diz=-"*, Consideremos, 
para ello, un vector arbitrario 


d == at, 5] Ej. ¿€ 11d: ... As Znl y (x, 76 0) (4) 
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de Wi. Para ¡>¿£ tenemos «€ %,. Supongamos que /< i. Aplicando 
a ambos miembros de (4) la aplicación (.4—p$y=!-*, obtenemos 


a(d—pó$y=17= Ata HA ate E gy pr E Y. 


Puesto que, por hipótesis, €;, ..., C, € Vi, resulta que e;-,E€EM y, 
por consiguiente, Y,_,<M lo que contradice a la elección de ¿. 
Por esto tenemos M<=Y,, de donde Mi =1,. 

Observemos además que la matriz de la aplicación wd no se des- 
compone en ningún sistema de coordenadas. 

Efectivamente, la descomposición de la matriz de .1 equi ale 
a la descomposición de * en una suma directa de subespacios inva- 
riantes, lu que es imposible ya que uno de dos subespacios inva- 
riantes cualesquiera de la aplicación .f debe estar contenido en el 
otro, mientras que los sumandos de una suma directa tienen inter- 
sección mula. 


12.3. Subespacios radicales. Las aplicaciones lineales, cuyas matri. 


ces pueden ser reducidas a la forma diagcnal o a una célula de 
Jordan, no abarcan todo el conjunto de matrices. En el caso general, 
la matriz de cualquier aplicación lineal sobre el cuerpo de los mÓú- 
meros complejos puede ser reducida a la forma celular diagonal con 
células de Jordan a lo largo de la diagonal. Se dice que las matrices 
de este último tipo son de Jordan o que tienen la forma nornul de 
Jordan. 

Supongamos que en una base €,, ..., €, la matriz de una apli- 
cación lineal 1 es de la forma normal de Jordan 


A=A,+A,+ ...+4s, (5) 
donde 41, es la célula de Jordan de orden », con el valor propio 
py (el, ...,5) y A+... nn. A ta célula A, le corresponde 


el subespacio invariante Y“ tendido sobre los vectores ep, +1, €p,+21 ..- 

cor ly (pp BN + Elis =P +11). La aplicación .£l induce 
en el subespacio Y una aplicación A ¡, cuya matriz es precisamente 
la célula A,. Según Jo expuesto, todos los vectores x de X'” satis- 
facen la relación 


Xd: Í — pá y” =0 
y, por consiguiente, también la relación 
X (ul —p $)" =0. (6) 


Sin embargo, ahora ya no se puede afismar que la relación (6) 
caracteriza sólo los vectores de %'”, ya que entre las células diago- 
nales pueden aparecer otras células con el mismo valor propio. Con 
el fin de examinar este problema más detalladamente, introduciremos 
la definición siguiente. 
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Un vector a se llama vector radical de altitud h correspondiente 
a la raiz p de una aplicación A, si 


a (pS — A)* =0. 


El concepto de vector radical es una generalización del concepto 
de vector propio, ya que los vectores propios son vectores radicales 
de altitud 1. 

El conjunto de todos los vectores radicales correspondientes a una 
raíz fija p de una aplicación A es un subespacio invariante Y, llamado 
subespacio radical de la aplicación £. 

Efectivamente, si x e y pertenecen a *, y son de altitud h, y 
h,. tenemos para hw=max (4%,, h,) 


(ax + By (pS — AY =ax (p6 — 4Y 4 By lod — AY" =0, 
xA lp — AY =x (pS — AY A =0. 

Los vectores radicales correspondientes a diferentes raices son 
necesariamente lienealmente independientes. Es más, tiene lugar un 
teorema más general. 

TEOREMA 3. Si una SUMa Xx, +X+... Xp =x de vectores radi- 
cales correspondientes a diferentes raices p,, ..., P, de la aplicación A 
está contenida en un subespacio invariante Vi, todo sumando por 
separado está contenido en M. 

Pongamos 


A A A A 
Por hipótesis, xp(4)€ Vi y, al mismo tiempo, 
XP(A) =p (A) 2... =X 2-0 (+1) =0. 
Por consiguiente, x,,p(4)E€ WI. Los polinomios (A) y (A—p,,)'w 
son primos entre sí. Luego, existen unos polinomios F(4) y G(4) 
tales que 
LU PA) PARA pp Y" GA), 
de donde 
$ =P(A) F (AJA (A — pon G (A) 
y, por consiguiente, 
X= XP (A) FA) AX (A — PY” GA) = A PLA) F (4) EM 


que es lo que se quería demostrar. 

La afirmación expuesta anteriormente acerca de la independencia 
lineal de los vectores x,, ..., X se obtiene del teorema demostrado 
tomando Wi =0. Como corolario nolemos también que diferentes 
subespacios radicales tienen intersección nuia. 

Volvamos ahora al caso en el que la matriz de una aplicación 
el tiene en una base ta forma normal de Jordan (5). Hemos definido 
más arriba dos series de subespacios: los subespacios radicales 
Lor...» Yo. y los subespacios Y", ..., 2 correspondientes a las 
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células diagonales de la matriz A. Para explicar la relación que 
existe entre ambas series indiquemos por VU" la suma de áquellos 
subespacios £'? que corresponden a las células con el valor propio p, 
y definamos análogamente Vi'”, ..., Vit”, En virtud de ello, uniendo 
en la descomposición 


Q = 41 1. Lim +...+ Qus 
determinados sumandos obtenemos la descomposición 


L=MVUSEDNPR... MN, (7) 

Está claro que MW<*Y, (í=1, ..., m). Por esto, además de (7), 
tiene lugar también la descomposición 

L=% ++... +2. (8) 

Puesto que, en virtud del teorema 3, la suma (8) es directa, obte- 

nemos, comparándola con (7), las igualdades requeridas Mi =Y,,. 

Es decir, si la matriz de una aplicación A puede ser reducida a 
la forma normal de Jordan, el espacio Y es la suma directa de los 
subespacios radicales de t y, además, cada uno de los subespacios 
radicales es, a su vez, la suma directa de los subespacios correspon - 
dientes a las células de Jurdan con el valor proptu dado. 

Los razonamientos expuestos permiten ver también que los sub- 
espacios radicales se determinan univocamente por la propia apli- 
cación 4 y no dependen de la selección de Ja base de coordenadas 
€. ---»» € En cuanto a los subespacios £'W, ellos dependen, en 
general, tanto de 4 como de la forma de reducción de la matriz 
a la forma diagonal. 


Ejemplos y problemas 


l. Supongamos que la aplicación 4 tiene en Ja base €,, .... € la matriz 
Am A + A2 + A,, donde A, = A=[0 6) y A=[o 7] . Los subespacios radi- 


cales de ,f son tad jad AE lo y Uy =kKeyt Ke, (K es el cuerpo 
principal), mientras que 140 me Ke, + Ke, y Um Ke, + Ke,. En la base nueva 


€,=8€,/+,, 8. =C¿¿+2€,, l: =P] —€,, 4 =l2 —€p, li=f, y Eg = ly 


la matriz de Y será la mismo; sin embargo, los subespacios Ke, + Ke, y Ke, -= Ke 
correspondientes a la células de Sfordan serán distintos. 
2 IHállense los polinomios minimos de las matrices 


ACA) 


3 Una matriz sobre el cuerpo de Jos números complejos puede ser reducida 
a la forma diagonal si, y sóto si, su polinomio mínimo no tiene raices múltiples. 
4. Si la matriz de una aplicación puede ser reducida a Ja forma normal de 
Jurdan, lodo subespacio invarlante suyo es suma directa de sus interseccio- 
nes con todos los subespacios radicales de la aplicación. 
Si una matriz de orden rn liene n diferentes números caracteristicos, la 
aplicación lineal «orrespondiente tine un lotal de 2% subespacio: invariantes 
inctuyeudu el subespacio mulo y tudo el espacto. 


Capítulo IV Matrices polinomiales 


Los elementos de casi todas las matrices que hemos estudiado 
hasta el momento eran números de un cuerpo principal K. Sin 
embargo, al introducir el concepto de polinomio característico nos 
hemos visto obligados a considerar la matriz característica AE— A, 
cuyos elementos no son números de K, sino polinomios en A con 
coeficientes de K, suponiendo, además, que K es un cuerpo conmu- 
tativo. En el capítulo presente nos ocuparemos del estudio sistemá- 
tico de las propiedades de las matrices polinomiales, es decir, de 
las matrices, cuyos elementos son polinomios en A con coeficientes 
de un cuérpo conmutativo principal. Aplicaremos después estos 
resultados al problema consistente en hallar la forma de Jordan de 
la matriz de una aplicación lineal. 
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13.1. Equivalencia. Consideremos una matriz cuadrada de orden 1 
k A sl 


Fra (A) o Frn lA) 
cuyos elementos son polinomios en la letra A con coeficientes de un 
campo principa] K. Llamaremos las matrices de este tipo polino- 
miales o A-matrices *. Frecuentemente resulta necesario realizar con 
¿-matrices las transformaciones siguientes: 
l. La multiplicación de una de las filas por un número de K 
diferente de cero. 
ll. La adición a una de las filas de la matriz de otra fila mul- 
tiplicada por un polinomio arbitrario f(A). 
1) Suponemos en todo momento que las matrices consideradas son cuadradas, 


«unque muchos de los resultados pueden ser extendidos directamente al caso de 
¿.-matrices rectangulares. 
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111. La multiplicación de una de las columnas por un número de 
K diferente de cero. 

1V. La adición a una «de las columnas de los elementos de otra 
volumna multiplicados por un polinomio arbitrario [ (4). 

Estas transiormaciones se llaman transformaciones elementales de 
/.- matrices. Si con una A-matriz se realiza una transformación ele- 
nmiuntal se obtiene de nuevo una ¿-matriz, con esta matriz se puede 
reulizar otra transformación elemental, etc. Se dice que una 4-ma- 
triz F es equivalente a una A-matriz G, si F se puede obtener de G 
mediante una cadena de transformaciones elementales, En muchas 
ucusiones resulta útil el lema siguiente: 

Mediante las transformaciones elementales 1 y 11 se pueden cam- 
biar entre si dos filas cualesquiera de una A-matriz y mediante las 
transformaciones elementales 111 y YV se pueden cambiar entre si dos 
columnas cualesquiera de la misma. 

En efecto, supongamos que es necesario cambiar entre sí la 
(¿sima y la j-ésima columnas de una matriz. Es fácil ver que esto 
se consigue realizando las siguientes transformaciones elementales: 
i) agregamos a la ¡-ésima fila la ¡-ésima; 2) a la ¡-ésima fila de 
la ratriz nueva agregamos su ¿-ésima fila multiplicada por —1; 
3) multiplicamos la j-ésima fila de la matriz obtenida por —1 y 
4) agregamos a la ¡sima fila de la última matriz su /-ésima fila 
multiplicada por —1l. Si realizamos transformaciones análogas con 
las columnas, lograremos cambiar de posición la ¿-ésima y la /-ésima 
coluimnas. Hemos demostrado el lema. 

De este lema se deduce que si la matriz F difiere de G en el 
orden de las columnas o de las filas, la matriz F es equivalente a G. 

De la definición de equivalencia de A-miatrices se desprenden 
directamente las propiedades siguientes: 

J. La relación de equivalencia es transitiva: si F es equivalente 
a G y Ges equivalente a H, resulta que F es equivalente a /7. 

En efecto, G se puede obtener, por hipótesis, de H y F de G 
mediante una cadena de transformaciones clementales; por consi- 
guiente, F se puede obtener mediante una cadena de transformacio- 
nes elementales de 7. 

2. La relación de equivalencia es simétrica: si F es equivalente 
a G, G es equivalente a F. En otras palabras, si F se puede obte- 
ner de G mediante una cadena de transformaciones elementales, 
también G se puede obtener de F mediante una cadena de trans- 
formaciones elementales, 

Demostremos primero que sí F se puede obtener de G mediante 
una transformación elemental, también G se puede obtener de F 
mediante una transformación elemental. Consideremos para ello, uno 
4 1mo, los cuatro tipos de las transformaciones elementales. Supon- 
gamos que F se obtiene de G mediante la transformación de tipo l, 
es decir, multiplicando una lila ¿-ésima de G por un número a 340, 
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Entonces, multiplicando la ¿-ésima fila de F por a”*, obtendremos, 
evidentemente, G. Supongamos ahora que F se obtiene de G me- 
diante una transformación de tipo 11, por ejemplo, agregando a la 
i-ósima fila de la matriz G su j-ésima fila multiplicada por f(A). 
En este caso, agregando a la ¿-ésima fila de la matriz F su /-ésima 
fila riuultiplicada por —+f(4), obtendremos de nuevo G. Lo mismo 
se puede decir acerca de las transformaciones de tipo 11I y JV. 
Vemos, por consiguiente, que para toda transformación elemental 
existe la transformación elemental inversa que anula el resultado 
de la primera. Por esto, si la matriz F se obtiene de G mediante 
una cadena de transformaciones elementales, resulta que realizando 
las transformaciones inversas en el orden contrario podremos obte- 
ner de la matriz F la matriz G que es lo que se quería demostrar. 

3. La relación de equivalencia es reflexiva: toda matriz es equi- 
valente a sí misma. 

Por ejemplo, realizando con F dos transformaciones recíproca- 
mente inversas, obtendremos de nuevo F. 


13.2. Forma diagonal. Acabamos de demostrar que la relación 
de equivalencia es transitiva, simétrica y reflexiva. De aquí se 
deduce que las A-matrices se descomponen en clases de matrices 
equivalentes. Surge el problema: ¿puede indicarse una forma para 
las A-matrices tal que en cada una de estas clases haya una matriz 
de la forma dada, y sólo una? Las formas con esta propiedad se 
denominan canónicas. Demostraremos que para las A-matrices la 
forma diagonal, con algunas condiciones complementarias de divisi- 
bilidad, es canónica en este sentido. 

DEFINICION. Una A-matriz de tipo 


CR.) E 
F¿(A) 


L A Aj 
se llama canónica diagonal, si todo elemento diagonal [, (A) divide al 
elemento siguiente f,,,(A) y si el coeficiente principal de todos los 
polinomios F[,(A), ..., f,(A) diferentes de cero es 1. 

De aquí se deduce que si entre los elementos diagonales de una 
matriz canónica diagonal aparecen ceros, estos elementos deben 
ocupar las posiciones últimas, ya que el cero no puede dividir a 
ningún polinomio no nulo. Por otro lado, si entre los elementos 
diagonales figuran números diferentes de cero, éstos deben ser igua- 
les a 1 y deben ocupar las posiciones primeras, ya que l no es 
divisible por ningún polinomio con coeficiente principal 1, a excep- 
ción del polinomio 1. Por consiguiente, en el caso más general la 
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matriz canónica diagonal es de la forma 
] 


“1 
FLA) 


E 0) 
0 
ol 


donde f, (A), ..., f(A) no son constantes, sus coeficientes principales 
son iguales a 1 ycada uno de ellos es divisor del siguiente. 
TEOREMA 1. Toda A-matriz puede ser reducida mediante un número 

finito de tranformaciones elementales a la forma canónica diagonal. 

*" DEMOSTRACIÓN. Sea G una A-matriz dada. Si G=0, nada hay 
que demostrar, puesto que O es ya de la forma normal. Suponga- 
mos por lo tanto que G +0, Escojarmos entre todas las A-matrices 
equivalentes a G aquella cuyo elemento del ángulo superior izquierdo 
sea diferente de cero y sea del grado minimo. Sea 


F li (A) ed Fr Ad 
fas 0) + fan (2) 
esta matriz. Demostremos que f,,(A) divide a todos los elementos 


de la primera fila y a todos los elementos de la primera columna 
de la matriz F. En efecto, sea 


FiW=fM70)+7/4) (i=l, 2, ..., 1), (1) 
donde q;(A) y r;,(A) son el cociente y el resto de la división de 
f,¡ (4) por f,,(4). Realicemnos con F la siguiente transiormación cle- 
mental: restemos de los elementos de la ¿<ésima columna los ele- 
mentos de la primera mutltiplicados por q,(A). La igualdad (t) 
muestra que el elemento de la primera fila y de la ¿-ésima columna 
de la matriz nueva resultará igual a r,(A). Si r;(A) 340, el grado 
de r;(A) es inferior al grado del divisor f,, (4). Cambiando entre sí 
la primera y la ¿-ésima columnas, obtendremos una matriz equiva- 
tente a- F en cuyo ángulo superior izquierdo figura un polinomio 
r,(A) de grado menor que el de f,, (A); pero esto contradice a la 
definición de la matriz h. Por consiguiente, r¿(4)=0. 

indicando ahora por q;(A) el cociente de la división de f,/(A) 
por f,, (A). realicemos con la matriz F las siguientes transformacio- 
nes elementales: de la segunda columna restemos la primera mui- 
tiplicada por q,(4), restemos después de la tercera columna la pri- 
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mera multiplicada por q,(A), etc. Realicemos a continuación 
transformaciones análogas con las filas. La matriz F resultará 
sustituida por la matriz equivalente 


E h na o. h da) 
Hal AA 2) 


0 RA)... han (MN) 


donde h,,(A) son unos polinomios determinados. 

Todos los polinomios h,,(A) son divisibles por f,, (4). Efectiva- 
mente, si f,,(A) no divide a uno de ellos, cleames a h,(A), 
entonces sumando a la primera fila de la matriz su ¿-ésima fila 
obtendremos una matriz Q con las siguientes propiedades: 

1) Q es equivalente a G, 

2) el elemento superior de la izquierda de la matriz Q es dife- 
rente de cero y es del menor grado, 

3) en la primera fila de la matriz Q le el elemento Aj, (A) 
que mo es divisible por el primer elemento de esta fila. 

Sin embargo, hemos visto que de las dos propiedades primeras 
se desprende que todos los elementos de la primera fila son divi- 
sibles por su primer elemento. Por consiguiente, la tercera propie- 
dad contradice a las dos primeras y nuestra proposición queda de- 
mostrada. Flemos probado, pues, que para toda A-matriz G existe 
una matriz equivalente H' de tipo (2), donde todos los h,,(A) son 
divisibles por f,, (A). Realicemos ahora transformaciones elementales 


con la matriz 
Bas (A)... Ran (A) 
H, -| | 


Bra (A) e» Ann (A) 

Toda transformación elemental de H, puede ser considerada también 
como una transformación elemental de la matriz H. Es fácil ver 
que la primera fila y la primera columna de la matriz A no varian 
en estas transformaciones. Además, puesto que todos los elementos 
de la matriz H, son divisibles por f,,(A), todos los elementos de 
las matrices nuevas, que surgen de H, como resultado de transfor- 
maciones elementales, también serán divisibles por f,, (A). 

Aplicando a la matriz H, el resultado demostrado anteriormente, 
veremos que H, puede ser reducida mediante transformaciones ele- 
mentales a la forma 


Bay 0.  ... 0 
0 BA)... Ranla) 


' 


O Ba)... And) 
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y, por consiguiente, la matriz H a la forma 


ÍA) 
A. 0.) 
ys 0)... Ban(A) 


Bra (A)... Ban (2) 


donde todos los h,,(A) (?, j=3, ..., n) son divisibles por R,, (A) 
y h,, (4) es divisible por f,, (A). Continuando este proceso obtendre- 
mos al cabo de un número finito de pasos la forma canónica dia- 
gonal requerida. 

De nuestra dernostración se puede extraer fácilmente un método 
practico de reducción de A-matrices a la forma canónica diagonal. 
Su idea consiste en disminuir primero, empleando las transforma- 
ciones elementales, el grado del elem: nto que figura en la primera 
fila y en la primera columna y e. convertir en cero los demás 
elementos de las mismas. Después le haber logrado este primer 
objetivo, aplicamos el mismo método al ángulo 4, que queda, etc. 

El teorema l afirma que toda clase de matrices equivalentes con- 
tiene al menos una matriz de forma canónica diagonal. En el punto 
siguiente quedará demostrado que esta matriz es única en cada clase. 


13.3. Máximos comunes divisores de menores. Sea F' una A-ma- 
triz de orden n. nsideremos todos sus menores de orden k 
(k=1, 2, ..., a). Estos menores son unos polinomios en A. Indi- 
quemos por D,(A) su máximo común divisor", Si resulta que todos 
los menores de un orden k son iguales a cero, aceptaremos por 
definición que D¿(A)=0. En particular, D, (A) es el máximo común 
divisor de los elementos de la matriz F, mientras que D,(A) es 
igual al determinante de F, dividido por su coeficiente principal. 

TEOREMA 2 Las %-matrices equivalentes tienen un mismo máximo 
común divisor de los menores de orden k (k=1, 2, ..., n). 

Sean F, y F, dos A-matrices equivalentes. Indiquemos los máximos 
comunes divisores de sus menores de orden £ por D,,(A) y Dj, (A), 
respectivamente. Debemos probar que D,, (A) = Da (4). Sabemos que 
F, puede ser obtenida de F, mediante una cadena de transforma- 
ciones elementales. Supongamos primero que esta cadena consta sólo 
de una transformación elemental. Por ejemplo, supongamos que F, 
se obtiene de F, multiplicando todos los elementos de la ¿-ésima 
fila de la matriz F, por un número «2 >+0. En este caso los menores 
respectivos de F, y de F, o bien son idénticos o bien difieren en el 


1) Convendremos en que el máximo común divisor es pl el común 
divisor del grado mayor de coeficiente principal igual a 1. Por ello, todos los 
polinomios D, (A) diferentes de cero son de coeficiente principal Igual a 1. 
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factor constante «a. Pero un factor constante no influye en el cálculo 
del máximo común divisor, de modo que D,, =D,.. Lo mismo stu- 
cederá en el caso en que F, se obtenga de F, multiplicando por « 
los elementos de una de las columnas de la matriz F,. Supongamos 
ahora que F, se obtiene de F, mediante las transformaciones de tipo 
ll o 1V; por ejemplo, aceptemos que F, se obtiene al agregar a la 
¿-ésima fila de la matriz F, los elementos de la /-ésima fila multi- 
plicados por f(A). Demostremos que D,, es divisible por D,,. 

En efecto, existen tres clases de menores de orden £ de las ma- 
trices F, y F,. A la primera pertenecen aquellos que no contienen 
elementos de ia f-ésima fila. En este caso los menores respectivos 
de las matrices F, y F, son, obviamente, iguales. A la segunda clase 
pertenecen aquellos menores que contienen elementos de la ¿-ésima 
Y de la j-ésima filas. Estos menores de las matrices F, y F, tam- 

ién serán iguales, ya que el valor de un determinante no se altera 
si a los elementos de una de sus filas se suman cantidades propor- 
cionales a los elementos de otra de sus filas. Finalmente, a la tercera 
clase pertenecen los menores que contienen elementos de la ¿-ésima 
fila y no contienen elementos de la ¡-ésima fila. Los menores res- 
pectivos de esta clase son de forma 


y a e a a Tr | 
fu +fw 10) .e».a fiv. Ef ve FA) » 


>P PO ..—.an—.onÁxx.oo.o. — .e 


fiv, ++» Fi, 


M,= , M,= 


donde las filas de ambos menores que no han sido escritas coinciden, 
En virtud del teorema de adición de determinantes, tenemos 


M,= ho sd his 


Fi, ea bio, 


+1 (1) =M,+ HN, 


donde N, es un menor de la matriz F,. Todos los menores de orden £ 
de la matriz F, son divisibles por D,,. De nuestros razonamientos 
se ve que D,, divide a todos los menores de orden k de la matriz 
F,, ya que éstos o bien coinciden con los menores respectivos de la 
matriz F, o bien se expresan linealmente en términos de los mismos. 
Pero en tal caso, D,, aparecerá como factor en el máximo común 
divisor de los menores de orden k de la matriz F,, es decir, será 
un factor en Dj. Por lo tanto, si F, se obtiene de F, mediante 
una sola transiormación elemental, resulta que D¿, es divisible por 
D,,- Realizando con F, la transformación elemental inversa, obten- 
dremos F,. Por ello, D,, debe ser también divisible por D,,. Pero, 
si los coeficientes principales de dos polinomios coinciden y si estos 
polinomios son divisibles uno por otro, ellos deben coincidir. Es 
decir, D¿ =D. Por ahora hemos demostrado la igualdad de los 
máximos comunes divisores suponiendo que F, se obtiene de F, 
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mediante una sola transformación elemental. Sin embargo, si D, (A) no 
varía en cualquier transformación elemental concreta, es obvio que 
D,¿(A) tampoco varía en el caso de varias transformaciones sucesivas. 
Por lo tanto, podemos considerar que el teorema 2 ha quedado de- 
mostrado en su forma general. 

Calculemos los polinomios D, (A), ..., D,(A) de una matriz de 
forma canónica diagonal 


1 4d, (A) 
d, (A) 


D= j 


de (A) 
Para obtener un menor de orden k debemos suprimir n-—k filas y 
n—Rk columnas de D. Si suprimimos en D la ¿-ésima fila, en su 
¿-ésima columna quedarán sólo ceros. Por ello, para obtener un me- 
nor diferente de cero, debemos suprimir en D todas las columnas 
cuyos números coinciden con los de las filas suprimidas. Es decir, 
los menores de orden k diferentes de cero deben ser de la forma 


dy, (A) 
dy, (A) 


=4,,(0) dy, (1). . «dy (8) (3) 


dd) 


El máximo común divisor de estos menores es D, (A). De las desi- 
gualdades 1 <v, <v,<...<vs¿<n se deduce que l < v,, 2< v,, 
..«, R< vs. Por lo tanto d,, (A) es divisible por d, (A), de modo que 
d, (2)...d,, (4) es divisible por d,(A)...d, (4). Vemos, por consi- 
guiente, que todos los menores de orden k de la matriz D son di- 
visibles por el menor 


d, (A) 
s =d,(%)...d, (A). (4) 
del») 


Si este menor es igual a cero, todos los menores de orden k de la 
matriz D también son iguales a cero. Por definición, tenemos en este 
caso D, (A) =0. Si el menor (4) es diferente de cero, los polinomios 
d,(%), ..., d,¿(A) son diferentes de cero y sus coeficientes principales 
son iguales a 1. Pero entonces también el coeficiente principal del 
menor (4) es igual a 1. Puesto que (4) divide a todos los menores 
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(3), resulta que D,(A) coincide con (4). En ambos casos tenemos, 
por consiguiente, 


D¿(0):==d,(1)d,(2)...d, (A) (£=1, 2, ..., A). (5) 


Así se calculan los polinomios D,(A) de una matriz canónica dia- 
gonat de elementos diagonales d, (A), ..., d, (A). 

Consideremos ahora una A-matriz arbitraria F. Indiquemos por 
D,(4) el máximo común divisor de los menores de orden k de esta 
matriz. Según el teorema 1, la matriz F puede ser reducida mediante 
transformaciones elementales a la forma canónica diagonal 


ná, (A) 
D= 
- d,() 


De acuerdo con el teorema 2 los polinomios D,(A) calculados para 
la matriz D coinciden con los respectivos polinomios D, (A) calcu- 
lados para F. Por consiguiente, los polinomios D,(A) de la matriz F 
y los elementos diagonales de la matriz canónica diagonal D, a la 
que se puede reducir F, están ligados por las relaciones (5). 
Supongamos que D, (A), ..., D,(A) son diferentes de cero y que 
los demás polinomios D,,,(A), ..., D, (A), si es que existen, son 
iguales a cero. Entonces de (5) obtenemos 


D, (A) =d, (+), d, (A) = D.(A), 

D,() =48,(4) 4, (0), d,(0)=D,(M:D,(A), 

D, (1) =d, (4)d, (4). ..d, (A), d,(4) =D, (A):D,..,(A), 
D.. (A) =8, (A) d, (A)... .d,(A)d,,,(A), do, (A) =D, ,, (4) :D, (4). 
Puesto que d,,,(A)=0, resulta que d,,,(A), .... d,(A) también 


deben ser iguales a cero y obtenemos definitivamente 


d, (1) =D, (A), d,(1) =D, (4):D, (A), ..., d, (4) =D, (4):D,-, (A), 
des (A) =... =d, (4) =0. (6) 


De esta forma hemos obtenido el teorema siguiente. 

TEOREMA 3. Si los máximos comunes divisores D, (A) de los meno- 
res de orden k de una d-matriz F son diferentes de cero parak=1, 
2, ..., 7 y sí D,,,(A)=0, los elementos diagonales d, (A) de la matriz 
canónica diagonal, a la que se reduce F mediante transformaciones 
elementales, se expresan en términos de D, (A) por las fórmulas (6) 
y. por consiguiente, la matriz F los define univocamente. 

Los polinomios d,(4), ..., 4,(A) se aman factores invariantes 
de la matriz E, 


lI—1843 
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El número r que figura en las igualdades (6) tiene un sentido 
muy simple: es el rango de la matriz F. Efectivamente, el rango 
de la matriz F es el orden máximo de los menores de F diferentes 
de cero. Si este orden es igual a r, tenemos en consecuencia que 
A OA: y que D,,,(A)=0. Recíprocamente, las condiciones 
D.(4) +0 y D.,,(.) =0 significan que uno de los menores de orden r 
es diferente de cero y que todos los menores de orden r+1 son 
iguales a cero. Por consiguiente, el rango de F es igual a r. 


13.4. Condiciones de equivalencia. Empleando los resultados del 
punto anterior es fácil encontrar las condiciones que garanticen que 


dos A-matrices dadas sean equivalentes. Representaremos estas con- 
diciones en dos formas. 


PRIMERA CONDICIÓN DE EQUIVALENCIA. Para que unas matrices po- 
linomiales de orden n sean equivalentes es necesario y suficiente que 
los máximos comunes divisores de sus menores de orden k coincidan 
para k=1, 2, ..., A. 

Puesto que la coincidencia de los máximos comunes divisores de 
los menores equivale a la coincidencia de los factores invariantes 
respectivos, la primera condición de equivalencia puede ser enun- 
ciada del modo siguiente: para la equivalencia de A-matrices es ne- 
cesario y suficiente que sus factores invariantes correspondientes sean 
iguales, 

La demostración es evidente. En efecto, si dos A-matrices F y G 
son equivalentes, sus máximos comunes divisores D,(A) son idénticos 
(teorena 2). Viceversa, si los polinomios D,(A) de F y de G son 
iguales, las matrices F y G se reducen mediante tramstormaciones 
elementales a una misma matriz canónica diagonal (teorema 3). Pero 
dos matrices equivalentes a una tercera son equivalentes; por con- 
siguiente F es equivalente a G que es lo que se queria demostrar. 


SEGUNDA CONDICIÓN DE EQUIVALENCIA. Para que unas matrices po- 
linomíates F y G de orden n sean equivalentes es necesario y sufi- 
ciente que satisfagan la relación 


G=PFQ, 


donde P y Q son unas matrices polinomiales de delerminantes cons- 
tantes diferentes de cero, 


1) Hemos definido la equivalencia de A-matrices mediante las transforma- 
ciones elementales. Con frecuencia el concepto de equivalencia se define también 
de otra manera. Se dice que dos A-matrices G y F son equivalentes, si existen 
unas matrices cuadradas regulares P y Q de delerminantes constantes que sa- 
tisfacen la relación G=P*Q. Entonces, la nda condición de equivalencia 
puede ser interpretada como el teorema de equivalencia de estos conceptos. 
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Antes de pasar a la demostración de esta proposición hagamos 
algunas observaciones. Sea 
F] 2 


A = a ¿-«ésima fila, 


l 

donde a es un número diferente de cero. Multiplicando a la izquier- 
da por Á una matriz cualquiera F, veremos que todos los ele- 
mentos de la matriz F' permanecerán intactos, menos los elementos 
de la ¿-ésima fila que resultarán multiplicados por a. Por consi* 
guiente, foda iransormación elemental de tipo 1 realizada con la 
matriz F equivale a la multiplicación de F a la izquierda por una 
matriz A convenientemente escogida. Análogamente, si multiplicamos 
la matriz F a la izquierda por la matriz 


Laia Oir De ¿0 
O... 1 $0) O 0 i-ésima fila 


j-ésima fila, 


SN a AS 


0.0... 1 
0...0... 0... 1] 


donde todos los elementos diagonales son iguales a la unidad, el 
elemento de la ¿-ésima fila y de la j-ésima columna es igual a f (A) 
y los restantes elementos son iguales a cero, resultará que a los 
elementos de la /-ésima fila de F se sumarán los elementos de. su 
j-ésima fila multiplicados por f(A). Por consiguiente, toda transfor- 
mación elemental de tipo 11 equivale a la multiplicación a la izquierda 
de la matriz F por una matriz B convenientemente escogida. 

Finalmente, es fácil comprobar de esta misma forma que tas 
transformaciones elementales de la matriz F de tipo MI y IV equi- 
valen a la multiplicación de F a la derecha por las matrices respec- 
tivas Á y B. 

Pasemos ahora a demostrar ta segunda condición de equiva- 
lencia. A 


1 
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NECESIDAD. Sea G una matriz equivalente a la matriz F. Esto 
significa que G se puede obtener de F mediante una cadena de trans- 
formaciones elementales sucesivas. Podemos sustituir cada una de las 
transformaciones elementales por la multiplicación por una matriz 
de tipo A o Bala izquierda o a la derecha, respectivamente. Como 
resultado obtendremos la igualadad 


G=PP,...P,FQQ,...Qa (7) 


donde cada una de las matrices P, y Q;,es de tipo A o B (1, ¡=1, 
2, ...). Pongamos 


P=P,P,...P, y Q:=0Q,0,...Q4 


Puesto que los determinantes de las matrices B son iguales a la 
unidad y los determinantes de las matrices A son números constantes 
diferentes de cero, resulta que los determinantes de las matrices P 
y Q también serán unos números constantes diferentes de cero. La 
relación (7) muestra que 


G=PFQ 


y la necesidad queda demostrada. 
SUFICIENCIA. Supongamos al contrario que 


G=PFQ, (8) 


donde P y Q son matrices polinomiales de determinantes constantes 
diferentes de cero, El máximo común divisor D,(A4) de todos los 
menores de orden » de la matriz P es igual al determinante de P, 
dividido por su coeficiente principal. Puesto que este determinante 
es un número constante, resulta que D,(A)= 1. Para k=n tenemos 
de las relaciones (5) 


D, (A) =d, (A) a, (A). -d,0)=1, 
y de aquí resulta 
d(04)=d40)=...=d,(M)=1, 


donde d, (A), ..., d,(A) son los factores invariantes de la matriz P. 
Pero los factores invariantes de la matriz unidad E también son 
todos iguales a la unidad, ya que E es de forma canónica diagonal. 
Según el primer criterio de equivalencia, de aquí se deduce que la 
matriz P es equivalente a E por consiguiente, puede ser obtenida 
de E mediante una cadena de transformaciones elementales. Toda 
transformación elemental puede ser sustituida por la multiplicación 
por una matriz de tipo A o B. Así P quedará representada en la 
*orma siguiente 


P=sP, ... P,EQ, +... Q¿=P, ... PQ, ... Q, 
donde P, y Q), son mátrices de tipo A y B. 
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Aplicando estos mismos razonamientos a la matriz Q, obtenemos 
un desarrollo análogo 


Q=M, -.. MN, ... No 
Iniroduciendo en (8) estas descomposiciones, llegamos a la igualdad 
G=P, pia PO, yd Q,FM, deis MN, pS NW, (9) 


de la cual se ve que G se obtiene multiplicando sucesivamente la 
matriz F por las matrices P,, Q,, M, y N, de tipo A o B. Pero 
cada multiplicación de esta índole equivale a una transformación 
elemental. Por consiguiente, G es equivalente a F y hemos concluidc 
la demostración. 


Ejemplos y problemas 


1]. Redúzcanse a la forma canónica diagonal mediante transiormaciunes 
elementales las matrices 


A—2 —1 0 MARIO 0 IA 4% 4 
| 0 1-2 =3) [ 0 A 0 y E O 
0 0 4-2 0 0 (4+I) LAS 22 —22 


2. Empleando los máximos comunes divisores de los menores, hállese la 
lorma canónica diagonal de las A-matrices 


410 0 a+dr B | 0 
DAS 0 =p ai 0 ) 
004A 1 y 0 0 a+ B 
54 3 1+2 0 0 —B a+ 


3. Demuéstrese que toda A-matriz rectangular de m fllas y de n columnas 
puede ser reducida mediante transformaciones elementales a la forma 


MA 0 ... 0 ...0 A e 
O da (A) ... 0 E A la forma 0 IM) 
o 0 de (A) ... 0 o 


¿Cómo debe enunciarse ta segunda condición de equivalencia para estas matrices? 
4. Demuéstrese que mediante las transformaciones elementales de tipo 1 y 1! 
toda A-matriz cuadrada puede ser reducida e la forma 


Ea AY 4 2) + Fin lA) 
aa (A) ... font?) 


Ena (A) 


donde tos elementos diagonales o bien son iguales a cero o bien son de coeficiente 
principal igual a 1. 

5. Consideremos en lugar de A-matrices las matrices formadas por números 
enteros. Las transformaciones elemenlales de estas matrices se definen del modo 
siguiente: |, multiplicación de una fila pot + 1; Jl, adición a los elementos de 
una fila de los elementos de otra cualquiera multiplicados por un número entero, 
111 y W, transformaciones similares de las columnas. Una matriz diagonal! 
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formada por números enteros se llama canónica, si sus elementos diagonales son 
no negativos y si todo elemento diagonal anterlor divide al que le sigue. Demué- 
strense los teoremas: a) toda matriz formada por números enteros puede ser 
reducida, mediante un número finito de transformaciones elementales, a la forma 
canónica diagonal; b) esta forma canónica diagonal es única y c) para la equi- 
valencia de dos matrices F y G formadas por números enteros es necesario y 
suficiente que para ellas sea válida la relación G =PFQ, donde P y Q son unas 
matrices formadas por números enteros, cuyos determinantes son iguales a + 1. 


$ 14. Divisores elementales 


Los factores invariantes determinan, salvo una equivalencia, la 
matriz polinomial F. Sin embargo, sí F se descompone en células 
diagonales, la relación entre los factores invariantes de la matriz F 
y los factores invariantes de las células resulta compleja. Por ello, 
conviene considerar en algunas cuestiones, en lugar de los factores 
invariantes, los así llamados divisores elementales de la matriz F, 
ya que el comportamiento de estos últimos en el caso de descom- 
posición de F es más sencillo. 


14.1. Relación con los factores invariantes. Consideremos una 
A-matriz arbitraria F, cuyos elementos son polinomios en A con 
coeficientes del campo principal K. No someteremos el cuerpo con: 
mutativo K a ninguna restricción. Sean d,(A), d,(A), ..., d, (A) 
los factores invariantes de la matriz FF. Parte de estos factores 
puede ser igual a cero; por ello, supondresmos, para concretar, que 
d,(A), ..., d, (4) son diferentes de cero y que d,.,, (A)=... =d,, (4) =0. 

| número r, como hemos visto anteriormente, es el rango de la 
matriz F. Descompongamos cada uno de los polinomios d, (A), ..., d,(A) 
en factores irreducibles sobre el cuerpo conmutativo K, Sea, por 


ejemplo, 

a, (A) = (e, (Ay) (e, (4)]"+ ... (e, (A)]", 
donde e,(A), ..., e,(4) son distintos polinomios irreducibles de 
coeficiente principal igual a 1. Las expresiones [e, (4), ..., [e,(A)) 


se llaman divisores elementales del factor invariante d,(A). Los divi- 
sores elementales de todos los factores invariantes de la matriz F 
que no sean constantes se llaman divisores elementales de esta matriz. 
Por ejemplo, si los factores invariantes de la matriz F son iguales, 
respectivamente a 1, A, 4? (4 +1) y 42 (4 + 1)?, sus divisores elemen- 
tales serán A, A?, 4%, A+-1, (4+1)?. Un divisor elemental de tipo 
[e (4)]*, donde e(4) es un polinomio irreducible, se llama pertene- 
ciente al polinomio e(A). En el ejemplo considerado los divisores 
elementales A, A? y 42 pertenecen a A, mientras que 441 y (A+ 1) 
pertenecen a A+ l. 

Tomemos ahora una A-matriz F y escribamos todos sus divisores 
elementales. Si uno de los divisores elementales de F figura en 
varios factores invariantes de F, lo escribiremos tantas veces cuantas 
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aparece en los factores invariantes. Demostremos que el sistema de 
divisores elementales obtenido de esta forma determina plenamente 
todos los factores invariantes de la matriz F diferentes de una 
constante; si tomamos en consideración, además, el orden y el 
rango de F, quedarán determinados todos los factores invariantes 
de la matriz F. 


TEOREMA 1. El orden, el rango y el sistema de divisores “elemen- 
tales de una h-matriz F determinan plenamente sus factores inva- 
ríantes y, por consiguiente, determinan F salvo una equivalencia. 


La demostración se aclara fácilmente con el ejemplo siguiente. 
Supongamos que F es de orden 6 y de rango 4 y que sus divisores 
elementales son A, A%, 4%, 44-1, (141), A—1 y A4—1. Puesto que 
el orden de F es 6, la matriz F tiene seis Paolo invariantes 
d,(A), ..., d¿ (A). Además, d, (A) =d,(4) =0, ya que el rango de F 
debe ser 4. Si descomponemos d, (4), ..., d,(A) en factores debemos 
obtener los siete divisores elementales indicados. Puesto que, sin 
embargo, d,(A) es divisible por d, (4), d,(A) y 4, (4), resulta que en 
d,(A) figuran los divisores elementales de potencia superior pertene- 
cientes a todos Jos polinomios irreducibles. Luego, d, (A) =22 (14 
+1) (A4—1). Entre los divisores elementales restantes 2, A*, 44-1 
y A=1 los de potencia superior deben componer d, (A); por consi- 
guiente, d,(1)=1*(4+ 1)(A—1). A su vez, los de potencia supe- 
rior de éntre los que an deben formar q, (A), es decir, d,(A)=4. 
Puesto que todos los divisores elementales han sido ya distribuidos, 
resulta que d,(A)=1. Es obvio que este método se puede aplicar 
en cualquier caso, lo que demuestra el teorema. 

Los divisores elementales dependen del campo principal K. Por 
ejemplo, supongamos que los factores invariantes de una A-matriz F 
son iguales a 142+1 y (4*+ 1)!. Si el campo principal es cuerpo de 
los números reales, el polinomio 12 +1 es irreducible y los divisores 
elementales de la matriz F son 1*+1 y (41 + 1)?. Sin embargo, si 
el campo principal es cuerpo de los números complejos, se tiene 
A 1=(A—i) (A+ 1) y los divisores elementales de F serán 4+!1, 
AFD. A—i y (Ai). 

14.2. Divisores elementales de una matriz descompuesta. Para 
obtener Jos divisores elementales de una A-matriz que tiene la forma 
canónica diagonal es suficiente tomar, de acuerdo con la definición, 
todos los divisores elementales de sus elementos diagonales. Mostre- 
mos que esta misma regla tiene lugar también para una A-matriz 
diagonal cualquiera. 

LEMA. El sistema de divisores elementales de una matriz diago- 
nal cualquiera F es la unión de los divisores elementales de sus 
elementos diagonales. 

Supongamos que los elementos diagonales de F son los polino- 
mios f,(A), f.(A), .... f,(4). Podemos aceptar, sin perder genera- 
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lidad, que todos estos polinomios son diferentes de cero y que sus 
coeficientes principales son iguales a 1. Indiquemos por D,(A) el 
máximo común divisor de los menores de orden % de la matriz F. 
Puesto que los coeficientes principales de los polinomios f, (A), ... 
...) fa(A) son iguales a la unidad, resulta que 0D, (A) es el deter- 
minante de la matriz F, es decir, 


D,0)=f, (1)F7,(A) AUS F. 0). 


Pero 

D, (A) =d, (A) d, (A) e... d,, (A), 
donde d, (A), ..., d, (A) son los factores invariantes de la matriz F. 
Por esto, indicando por e, (A), €, (4), ..., €,(A) los distintos factores 
irreducibles de los polinomios f,(A), ..., f,(A), podernos ver que 


todo divisor elemental de la matriz F es uma potencia de uno de 
los polinomios e, (A), ..., €, (A). Despejemos ahora en f, (A), ..., f, (A) 
las potencias máximas de e,(A) por las que son divisibles estos 
polinomios. Sea 


FA) = [6,91 ELA) ((=1, 2, ..., nm, 


donde g,(A) no es divisible por e, (A). Queremos probar que 
[e, (2)]9, ..., [e, (4)]* es precisamente el sistema de divisores ele- 
mentales de la matriz F pertenecientes al polinomio irreducible e, (A). 
Puesto que los divisores elementales de la matriz F no dependen 
del orden de sus filas y de sus columnas, podemos disponer estas 
filas y columnas de modo que 


5 <5<S .-. <Sp: (1) 


Hallemos la potencia superior con la que e, (A) figura en D, (A). 
Por definición, D, (A) es el máximo común divisor 5 los menores 
de orden k de la matriz F, entre los cuales, como hemos visto 
anteriormente (p. 13.3), serán diferentes de cero sólo los menores 
iguales a 


Po, (A)... fop(A)=[e, MJ og, (2). Bop (A) 


En vista de las desigualdades (1), la menor potencia de e, (A) ta 
tiene el menor 


EGO)... LM) (e, AyJt tg, (A)... gríA). 


Por consiguiente, D, (A) contiene e, (A) en la potencia s, +... +8. 
Sustituyendo aquí R por k—I, obtenemos que D,-, (4) contiene 
e, (A) en la potencia s,+...-FSg-,. Pero el factor invariante d, (A) 
es igual al cociente de D, (4) por D,.., (A). Por esto d, (A) contiene 
e, (A) exactamente en la potencia s,. Luego, los divisores elemen- 
tales de la matriz F pertenecientes al polinomio irreducible e, (A) 
coinciden con los divisores elementales pertenecientes a e, (A) de los 
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elementos diagonales de la matriz F. Puesto que nuestro razona: 
miento es válido también para los demás polinomios €, (24), ..., €, (4). 
el lema queda demostrado en el caso más general. 

TEOREMA 2. El sistema de divisores elementales de una matriz 
descompuesta es igual a la unión de los sistemas de divisores elemen- 
tales de sus células. 

Sea F una A-matriz de forma celular diagonal 


Las transformaciones elementales de cada una de las células 
F,, ..., F, pueden ser consideradas como transiormaciones de toda 
la matriz F. Estas transformaciones no alteran la estructura celular 
diagonal de la matriz F y las transformaciones, realizadas con una 
de las células, no alteran la forma de las restantes. Por esto, 
mediante transformaciones elementales de la matriz F se pueden 
reducir todas las células a la forma diagonal. Aplicando el lema 
vemos que los divisores elementales de las matrices F, F,, ..., Fa 
serán las uniones de los divisores elementales de aquellos elementos 
diagonales que figuran en estas matrices. En particular, los divi- 
sores elementales de la matriz F se obtienen uniendo los divisores 
elementales de todos Jos elementos diagonales, es decir, uniendo los 
divisores elementales de todas las células F,, ..., F,, que es lo 
que se quería demostrar. 


Ejemplos y problemas 
J. Hállense los divisores elementales de las matrices siguientes: 


A 1 0 0 l 1+2 0 0 o 13 
Al 0 J] 1+2 y 0 0 A (A — |) 
41! 1 1+2 0 (1-1) 

A A+2 A(A—1) 
2. Hállense los factores invariantes de las matrices: 

2(1+1) 1123 1100 

42 A 12 y 0410 

(A+ 1) : A ) 0l14o0l' 
A (A—1) A 00UIA 


3. Hállense los divisores elementales de la matriz. 
4242 1149] 4141 
3 4241 3 
LE, ML EN 


en el cuerpo de los números racionales, en el cuerpo de los números reales y er, 
el cuerpo de los números complejos. 


- 
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$ 15. Formas normales de la matriz de una aplicación 
lineal 


15.1. División de A-matrices. Se llama polinomio matricial en 
la variable A la expresión de tipo 


F(A) = AJA AA ALA PA, (1) 


donde A,, ..., A,, son matrices cuadradas de un mismo orden y 
con elementos de un campo principal K. Dos polinomios se llaman 
iguales, si son iguales las matrices que figuran en estos polinomios 
en los términos con la misma potencia de la variable A. Los A-poli- 
nomios matriciales se suman y se multiplican siguiendo las reglas 
habituales. Está claro que todo A-polinomio puede ser representado 
mediante una matriz, cuyos términos son polinomios corrientes en A, 
y viceversa. Por ejemplo 


1 2 5 6 101412 _ [A2+54+1 64 + 2 

lo 3)+|; 2] a+ [o JE =| TA. 2213): 

Luego, los A-polinomios matriciales son simplemente una forma 
especial de representación de A-matrices. 

Si la matriz A, de un A-polinomio (1) es diferente de la nula, 
se dice que m es el grado del polinomio matricial. El polinomio 
F (A) se Mama regular, si la matriz A, es invertible. 

Es evidente que el grado de una suma de A-polinomios matricia- 
les no sobrepasa el máximo de los grados de los sumandos. Mediante 
ejemplos es fácil comprobar que el grado del producto de dos A-poli- 
nomios matriciales puede resultar menor que la suma de los grados 
de los factores. Sin embargo, si al menos uno de los dos polinomios 
que se multiplican es regular, el grado del producto es igual exac- 
tamente a la suma de los grados de los factores. 

En efecto, si 


A) = ARAS bh A, ió) 
B(A)=BA"+B4024...+B, 


y si B, es invertible, el término principal del producto A (A)- B (A) 
es igual a A,B,A*+*” y de A,B,=0 resulta que O = 4,B,B,”! = A, 
lo que contradice a lo supuesto. 

TEOREMA 1. Cualesquiera que sean un ).-polinomio matricial A(A) 
y un A-polinomio regular B (A) existen unos 4-polinomios P (A), S (A), 
Q(A) y RÁ) que satisfacen las condiciones 

a) A(M)=B(A)PW)+S() y A()=Q(0)B()+RI(4): 

b) o bien S(A)=0 o bien el grado de S (A) es menor que el grado 
Je B(A); o bien R(A)=0 o bien el grado de R(A) es menor que el 
grado de B (A). 
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Los polinomios indicados se determinan univocamente por las con- 
diciones a) y b) y se dice que P(A) y S(A) son el cociente y el resto 
a la izquierda y que Q(A) y R(A) son el cociente y el resto a la 
derecha de la división de A(A) por B(A). 


La demostración consistirá en que indicaremos un método que 
permite encontrar los cocientes y los restos y que, en el caso cort- 
siderado, coincide con el algoritmo de división de los polinomios 
corrientes. Supongamos, por ejemplo, que A (4) y B (A) son de forma (2). 
Si es m< p, podemos tomar P(A)=0 y S(A)= A(A). Sea, pues, 
m > p. Formamos las siguientes diferencias sucesivas 

S, (A) = A (1Y)— 4,B'4*7PB (4) =CPA ME .., 
Sy (1) =S,(M)—COBAMPB()]=CSM A, 


Si+ 1 (1)=S, (A) —CjP BG TD B (A) um CS* DA M0 
donde los puntos suspensivos representan términos de grados inferiores 
y donde m,,, < p. Sumando estas igualdades y tomando 

S (A) = Str (A), 

P(A)=AJB UPA COPBAAMPP POP BG AMP, 
obtenernos la primera de las relaciones a). Análogamente se deter. 


minan Q (A) y RÍA). 
Resta demostrar la unicidad. Pero, si 


A(1) =B (4) PA) +58 (1) =B (M1) P, (A) +5S, 0), 


se tiene 
B(A) [P 0) —P, (4)] =S.(A)—S (4). 


Puesto que el polinomio B(A1) es regular, resulta que si la dife- 
rencia P (A) —P, (A) es no nula, el grado del primer miembro es no 
menor que el grado de B(A), mientras que el grado del segundo 
miembro es, indudablemente, menor que el grado de B(1). Por esto 
debe ser P(A) =P, (A) y S(A) =S, (A). 


15.2. Equivalencia escalar. Según el p. 13.4, dos A-matrices 
A() y 'B(A) son equivalentes si, y sólo si, existen unas A-matrices 
U(A) y V(A), de determinantes no nulos que no dependen de 4, 
que satisfacen la relación 


A(A) = U(A) B(A) V (4). (3) 


Diremos que la matriz A(A) es escalarmente equivalente a la matriz 
B(A), si existen unas matrices regulares U y V, formadas por ele- 
mentos que no dependen de A, que satisfacen la relación (3). Las 
matrices formadas por elementos que no dependen de A se llamarán 
escalares. 
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TEOREMA 2. Si dos A-polinomios de primer grado Adk+ B y CA+ 0D 
son regulares y equivalentes, también son escalarmente equivalentes. 
Por hipótesis tenemos 
AA + B=U (A) (CA + D)V (2.), (4) 
donde U (A) y V(A) son matrices de determinantes constantes dife- 
rentes de cero. Indiquemos por P y $ el cociente y el resto a la 
izquierda de la división de U (A) por AA+ Be indiquemos por Q y R 
el cociente y el resto a la derecha de la división de V (A) por 414 + B. 


Es decir, 
U=>(AM+FBPSS y V=Q(AL+ B)+R. (5) 
Las matrices S y R son escalares, ya que son de grado menor que 
la unidad. Probemnos que 
AA+ B=S(CA+ DR. (6) 
Efectivamente, multiplicando por U”* ambos miembros de la ¡gual- 


dad (4), sustituyendo Y por su expresión (5) y agrupando los tér- 
minos, obteneinos 


(U=* —(Ch+D)Q] (44 + 8) =(CA + D) R. 
Comparando los grados del primero y del segundo rniembros veremos 


que la expresión que figura entre los corchetes debe ser igual a una 
matriz escalar 7; tenemos, pues, que 


T=eaU“T—(CAF+4D)JQ y T(AA+B)=(CA+F D)R. (7) 
De aquí resulta que 

E=U(CA+D)Q+UT =(A1+ B)V-1Q4UT= 

= (Al + B)V"2QH+[(44 + B)P+SJ)T7, 
E =(Ar + B)[V-*Q + PT] +ST. 
Pero el segundo miembro puede ser de grado nulo sólo en el caso 
en que sea cero la expresión que figura entre los corchetes, de donde 
E=ST y T=8S-!, 


Comparando con (7), obtenemos (6), donde S y, por consiguiente, 
R son matrices escalares invertibles. 


es decir, 


15.3. Criterio de semejanza de matrices. Según el p. 3.1, dos 


matrices A y B sobre un cuerpo conmutativo K se llaman semejantes 


si existe una matriz invertible T, formada por elementos de K, tal que 
A=T- BT. (8) 


En el capítulo 111 se ha explicado la importancia que tiene el en. 
contrar las condiciones de semejanza de unas matrices dadas. Em- 
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pleando los resultados obtenidos es fácil indicar las condiciones 

necesarias y suficientes de semejanza de matrices y resolver, con 

ello, uno de los problemas principales de la teoría de matrices. 
TEOREMA 3. Para que las matrices A y B, definidas sobre un cuerpo 

conmutativo arbitrario K, sean semejantes es necesario y suficiente 

que sus matrices caracteristicas AE—A y AE—B sean equivalentes. 
La necesidad es evidente, ya que de (8) se deduce que 


AE—A=T="(QE—B)T, 


es decir, que AE—B y AE—A son equivalentes y, es más, son 
escalarmente equivalentes. Viceversa, supongamos que las matrices 
AE—B y AE—A son equivalentes. Puesto que representan 'unos 
A¿-potinomios matriciales regulares y de primer grado, resulta que 
estas matrices son, en virtud del teorema 2, escalarmente equivalen- 
tes, es decir, existen unas matrices S y R escalares y regulares 
tales que 
AE—A=SMAE—B)R. 


Comparando en esta igualdad los coeficientes de A y los términos 
independientes, obtenemos 


E=SR y A=SBR, 
de donde resulta 
A =RúUBR (9) 


que es lo que se quería demostrar. 

De los teoremas demostrados se puede extraer el siguiente algo- 
ritmo para determinar la semejanza de las matrices A y B: forma- 
mos las matrices características AE—A y AE—B y, empleando el 
proceso descrito en el p. 13.2, las reducimos mediante transforma- 
ciones elementales a la forma canónica diagonal. Si estas formas 
coinciden, las matrices A y B son semejantes; si las formas son 
distintas, las matrices A y B no son semejantes. 

A veces, además de establecer el hecho mismo de semejanza, es 
necesario hallar también la matriz transformador: T tal que 
B«=T-1AT. Con este fin, para pequeños valores del orden y: de las 
matrices consideradas, se toma T=|jf,,[], se escribe la igualdad 
matricial TB =AT en forma de n*? igualdades entre los elementos 
de TB y AT y se consideran estas igualdades como ecuaciones li- 
neales homogéneas respecto a las n? Ine cgmlas ti, j=1,2,..., 1). 
Resolviendo este sistema, se determina 7. 

El método expuesto resulta muy voluminoso para grandes valores 
de n y en este caso es preferible seguir el camino indicado en la 
propia demostración del teorema 3. Ante todo, conociendo las tran- 
sformaciones elementales que reducen las matrices AE—A y AE—B 
a la forma canónica diagonal y conociendo, por consiguiente, las 
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transformaciones elementales que reducen AE—A a AE—B, podemos 
encontrar, de acuerdo con el p. 13.4, unas A-matrices U (A) y V (A) 
tales que 

AE=A =U(A) AE — B) V (A). 


Calculando el resto a la derecha R de la división de V (A) por AE —A, 
tendremos, según (9), A=R”!BR, es decir, R será una de las mat- 
rices transformadoras que buscamos. 

Notemos que para determinar R no es necesario realizar de hecho 
la división de V(A) por AE— A. En efecto, representando V (A) en la 


forma 
V (A) =V AP VU At ++ Vs 
y aplicando el esquema de división del p. 15.1, obtenemos 
R=V,AFEAVLA O + V, (10) 
Anaálogamente, representando el polinomio U(A) en la forma «iz- 


quierda» 
U (A) =»U +A TU +... + U, 


y realizando la división a la izquierda por AE— A, obtenemos para 
el resto a la izquierda S la expresión 


S= AURA MU, +... +U. (11) 


Estas fórmulas para los restos de la división de un A-polinomio 
matricial por el binomio A4£— A son totalmente análogas a la formula 
de Bezout r=f(a) para el resto de la división de un polinomio 
corriente f(A) por el binomio A—a. Por esto las fórmulas (10) y (11) 
a veces se denominan fórmulas matriciales de Bezout para los restos. 


15.4. Forma normal de Jordan. En el p. 12.2 hemos introducido 
unas matrices de forma especial que hemos llamado matrices de Jordan 
y hemos estudiado algunas propiedades de las aplicaciones lineales, 
cuyas matrices en un sistema de coordenadas adecuado tienen la 
forma de Jordan. Sin embargo, hemos dejado sin resolver el problema 
principal acerca de las condiciones en las que la matriz de una 
aplicación puede ser reducida a la forma de Jordan. Pero ahora 
tenemos ya todos los medios necesarios para resolver este problema. 

TEOREMA 4. Toda matriz cuadrada sobre el cuerpo de los números 
complejos, ast como sobre cualquier otro cuerpo conmutativo algebrai- 
camente cerrado, es semejante a una matriz de la forma de Jordan. 
Dos matrices de Jordan son semejantes si, y sólo si, están compuestas 
por tas mismas células de Jordan y difieren una de la otra a lo sumo 
en la disposición de las células a lo largo de la d: 1gonal principal. 

Anteponemos a la demostración del teorema dos 'emas que tienen 
también interés por sí solos. 
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LEMA 1. La matriz característica de una célula de Jordan tiene 
sólo un divisor elemental (A —p)", donde n es el orden de la célula y p 
es su valor propio. 

La matriz caracteristica de uma célula de Jordan dada (véase 
el p. 12.2) es de la forma 


Ap  —1 0... 0 
AP =—=1l... 0 0 

iE=zA=| ¿ner scr. A 

L AP ] 

Calculemos el máximo común divisor D, (A) de los menores de orden 
k de la matriz AE— A. Ante todo, tenemos 
Después, D,,_,(A) es el máximo común divisor de todos los menores 
de orden n—l1. Pero entre los últimos figura el menor 


—] Oui 0 0 
AP —1 ... 0 0 

AP... 0 0| =(—1)"7* 
Ap —1 


que se obtiene a) suprimir la primera columna y la última fila en 
la matriz AE—A. Puesto que este menor es igual a +1, resulta 
que D,,-, (4) =1. Indiquemos por d,(4), ..., d, (9 los factores inva- 
riantes de la matriz A£-—-A. De las relaciones 


D, 1 (A) =4, (A) ..s dn-1(4)=1, 
D, (A)=d,(4) -.. d,-,(1)4, (4) =(1—p)” 


se desprende que d,(A)=... =d4,.,(4)=1 y que 4, (4) =(1—p)”. 
Por consiguiente, AE—A tiene sólo un divisor elemental y este 
divisor es igual a (A—.p)”. 

LEMA 2 El sistema de divisores elementales de la matriz caracte- 
rística de una matriz de Jordan se compone de los divisores elemen- 
tales de sus célutas de Jordan y determina univocamente, salvo el orden 
de secuencia de las células a lo largo de la diagonal principal, la 
forma de la matriz de Jordan. 

Una matriz de Jordan es, por definición, una matriz celular 
diagonal con células de Jordan a lo largo de la diagonal principal. 
Por ello, la matriz caracteristica de una matriz de Jordan se des- 
compone en las matrices características de las células de Jordan 
aisladas. De aquí se deduce, en virtud del p. 14.2, que el sistema 
de divisores elementales de la matriz característica de una matriz 
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de Jordan consta de los divisores elemzntales de Jas matrices ca- 
racterísticas de cada una de las cólulas de Jordan, habiendo un 
divisor por cada una de estas células. Luego, el sistema de divisores 
elementales de la matriz característica de una matriz de Jordan 
determina la forma de esta matriz univocamente, salvo el orden 
de secuencia de las células a lo largo de la diagonal principal. 

Las matrices características de matrices semejantes son equiva- 
lentes y, por lo tanto, tienen los mismos sistemas de divisores ele- 
mentales. De aquí se deduce que las matrices semejantes de Jordan 
deben estar formadas por células iguales de Jordan y, para concluir 
la demostración del teorema 4, resta sólo saber cómo obtener a 

artir de toda matriz dada A la matriz de Jordan a a ella. 

a (A—p)”, ..., (A—p,)"s el conjunto completo de los divisores 
elementales de la matriz caracteristica AE— A. Indiquemos por B 
la matriz celular diagonal, cuyas células diagonales son las células 
de Jordan con los divisores elementales señalados. Luego, la matriz 
AEB tendrá los mismos divisores elementales que tiene AE— A. 
Pero entonces, según el p. 14.1, las matrices AE—A y ¿AE—B son 
equivalentes y de aqui se desprende, en virtud del p. 15.3, que la 
matriz A es semejante a la matriz de Jordan B. Hemos demostrado 
el teorema. 

Los razonamientos expuestos ofrecen también una respuesta a la 
pregunta de cómo hallar a partir de una matriz dada A su matriz 
semejante de Jordan. Para ello es suficiente formar la matriz ca- 
racterística AE— A, reducirla mediante transtermaciones elementales 
a la forma canónica diagonal, descomponer en factores los polinomios 
diagonales, hallar los divisores elementales y construir a partir de 
los mismos la matriz de Jordan. Sea, por ejemplo, 


3 l —3 
A=|-.7 —2 9|. 
—2 —] 4 


Formamos la matriz característica 
A=3 —l 3 
AE—A=| 7 142 —9 
2 A 
determinamos sus factores invariantes. Es fácil ver que estos fac- 


ores son 1, 1, (A—1)(A—2)?. Por consiguiente, los divisores ele- 
mentales serán A— 1 y (A—2)* y la matriz de Jordan es 


100 
B=|02 1]. 
002 
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Para terminar hagamos una observación más. Si los divisores 
elementales de la matriz A£— A resultan de primer grado, las cé.- 
lulas de Jordan de la matriz de Jordan correspondiente B serán de 
primer orden, es decir, la matriz B será diagonal. Recíiprocamente, 
si la correspondiente matriz de Jordan es diagonal, los divisores 
elementales serán de primer grado. Por consiguiente, para que una 
matriz dada sea semejante a una diagonal es necesario y suficiente 
que todos los divisores elementales de su matriz característica sean de 
primer grado. 


15.5. Forma normal natural. En el cuerpo de los números complejos toda 


matriz es equivalente a una matriz de Jordan determinada. Si el campo prin- 
cipal K es un cuerpo conmutativo arbitrario, la reducción a la forma de Jordan 
puede resultar imposible. En todo caso, para que esta reducción sea posible es 
necesario, y como puede verse fácilmente también es suficiente, que el polinomio 
característico de la matriz se descomponga sobre X en factores lincales. Es por 
esto que surge el problema de indicar una forma normal a la que puede ser 
reducida la matriz sobre el cuerpo conmutativo del que se toman sus elemen- 
tos. Exlste una cantidad infinita de formas normales de esta índole. Entre éstas 
se obtiene con mayor facilidad la forma normal llomada natural. 


Sea ] 
[AQ =p ¡Ani An 
un polinomio cualgulera de grado no nulo y de coeficiente principal igual a la 


unidad. Aceptaremos que los coeficientes del polinomio f(A) pertenecen a un 
cuerpo conmutativo K, La matriz 


0 1 0 ... 0 0 
0 0 h 0 0 
e da ii de 


— Oy —Uy —QUg ... — Ugg Um] 
se llama matriz asoctada del polinomio f (A). 

LEMA 3. Si / (A) es un polinomio de grado no nulo y de coeficiente princi- 
pal 1 y sit A es su matriz asociada, los factores invariantes de la maíriz caruc- 
terística AE-—A son Iguales a 1, dl, ..., 1, F(A). 

En efecto, si f(A)= a, +2) «FG per”T 144, se tiene 

A —=1 0... 0 0 


0 0... A =i ñ 
Ap Ay Ugg »». Empog A+ Sna-1 


Suprimiendo la primera columna y la última fila obtenemos un menor igual a 
(—1)?-!, Por consiguiente, el máximo común divisor D,-, (A) de los menores 
de orden n—1 es igual a la unidad. En cuento a D, (A), este polinomio es 
igual a] determinante de la matriz AE—A. Desarrollando este determinante 
según los elementos de la última fila, encontraremos directamente que 


Da (A) =%.+a14+ a «27-114 48, 


De D,-1(4)=! se deduce que d, (A) =...=d5.1 (A)=l y de D, (A) =f (A) se 
desprende que d, (A) =f (A) > es lo que se quería demostrar. 

dice que la matriz es de forma normal nalural, si Á se descompone 
en células Ar. Az ..-» As que son las matrices asociadas de unos polinomios 


123843 
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fi (A), fa (A), .... Ffs(4) cada uno de los cuales es divisible por el anterior. 
Probemos que los factores invarlantes de la matriz A son iguales a 1, ..., l, 
fx (A), Fa(A), -... Fs (A), donde el número de unidades es igual a la suma de 
los grados de los polincaries FL (A), --., Fs (A) disminuida en s. Efectivamente, 
la matriz caracteristica es de la forma 

CAE, — A, 


«— Az 


AE — A== 


A ] 


Según el lema, toda célula A£¡— A¡ puede ser reducida mediante transforma- 
clones elementales a la forma diagonal en la que los elementos diagonales 
serán 1, ..., 1, f;(A). Cambiando después en la matriz AE—A el orden de 
las filas y de las columnas, la reduciremos a la forma diagonal con los ele- 
mentos diagonales 1, ..., 1 f,(A), ..., f¿(A). Puesto que todo elemento aqui 
es divisible por el anterior, ésta será la forma canónica diagonal y los elemen- 
tos 1, ..., Il, f (A), .... fp(A) serán tos factores invariantes de la matriz 
AE— A. Como quiera que el orden de la matriz A era igual a la suma de 
los grados de los polinomios f, (A). ..., fy(A) y el número total de factores 
invariantes es igual al orden de la matriz, resulta que el número de unidades 
que figuran entre los factores invariantes coincide con el señalado. 

De nuestro razonamiento se desprende, en particular, que la forma normal 
natural queda unfvocamente determinada por los factores invariantes de su 
matriz característica, 

Ahora podemos demostrar en unas palabras el teorema siguiente. 

TEOREMA 5. Toda matriz A con elementos de un cuerpo cornmutativo K se 
reduce sobre este cuerpo a una forma normal natural, y sólo una. 

an l, ..., 1 fi(A), -.., fs(A) los factores invariantes de Ja matriz 
A£— A. Puesto que la suma de los grados de todos los factores invariantes 
debe ser igual al orden de la matriz A, resulta que el número de unidades que 
figuran aquí es igual a la suma de los grados de los polinomios f, (A), ..., f¿(A) 
disminuida en s. Construyamos para cada uno de los polinomios fi (A) su ma- 
triz asociada B, y consideremos la matriz celular ona de células diagonales 
Br .-.» Bs. Como todo aos Fi ae divisible por el anterior, 4 es la 
matriz normal natural. gún hemos mostrado anteriormente, los factores 
invarlantes de la matriz AE—B son iguales a l, ..., Il, f,fA). ..., Ffy(A) y 
coinciden, por consiguiente, con los factores invariantes de la matriz AE — A. 
De aquí se deduce, en virtud del teorema 3, que A es semejante a B. Con esto 
queda demostrada la posibilidad de reducir la matriz A a la forma normal na- 
tural. La unicidad resulta de que la matriz natural B se determina unívoca: 
mente por los factores invariantes, que, a su vez, se determinan univocamente 
por la matriz A. 


16.6. Otras formas normales. La ventaja de ta forma normal natural estriba 


en que es absolutamente unívoca: tanto las propias células diagonales como el 
orden en que están dispuestas a to largo de Ja diagonal principal se determinan 
univocamente. Entre los defectos figura el que esta forma no ofrece la reduc- 
ción a las células de menor orden pasible así como el que no comprende la 
forma de Jordan como un caso particular. 
El primero de estos defectos pues ser superado del modo siguiente. Con- 
vengamos en llamar una matriz 8 casinatural, sí DB se descompone en células 
sw ---» Bs que representan las matrices asociadas de polinomios de tipo 
[ey (A), ..., [es (A)]”*, donde 8; (A), ..., 8,(4) son polinomios Irreducibles 
sobre el campo principai K de coeficientes principales iguales a 1. Puesto que 
B, es la matriz asociada del polinomio (8, (4)]”*, las factores invariantes de la 
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matriz característica A£¡— B, son iguales a 1, ..,, 1, [e,(A)]”, Por consiguien- 
te, A£¡—Bj tiene un único divisor elemental [e; (A))”* y los divisores elemen- 
tales de la matriz AEB serán [e, (4)]"*, ..., [es (4)]7*, Puesto que el sango 
de la matriz AE—B es igual a su orden y es igual a la suma de los grados de 


tos polinomios (e; (2)]”*, resulta que la matriz casinatural se determina por sus 
divisores elementales univocamente, salvo el orden de disposición de las células 
a lo largo de la diagonal principal. 

Igual que en el punto anterior de aquí se desprende directamente que toda 
matriz A formada por elementos de un cuerpo conmutativo X se reduce sobre 
este cuerpo a la forma normal casinatural. Esta forma queda determinada por 
la matriz Á univocamente, salvo el orden en el que siguen las células a lo lar- 
go de la diagonal principal. 

Las células de la forma casinatural no pueden ser descompuestas sobre el 
cuerpo conmutativo K en células de menor orden, ya que si esta descomposi- 
ción fuese posible, resultaría que la matriz característica de la célula tendría 
por lo menos dos divisores elementales en lugar de uno. 

Para concluir examinemos la forma normal que pue ser considerada como 
una generalización de la forma de Jordan al caso de subcuerpos conmutativos 
arbitrarios K del cuerpo de Jos números complejos '). Sea e(A) un polinomio 
irreducible con coeficientes de K. Aceptaremos que el polinomio e(A4) es de 
grado no nulo y que su coeficiente principal es igual a la unidad. 

LEMA 4. Sí el polinomio característico de una matriz A formada por ele- 
mentos de un cuerpo conmutafivo numérico K es irreducible sobre K y es igual a 
e(4), la matriz celular 


AE0 ...0 
A E ... 0 
A E 

Á 

donde E es la mafriz unidad, tiene una matriz característica que posee un único 
divisor elemental [e (A)P", donde m es el número de células diagonales de la 


matriz B. 
Sea AE — A =P; entonces 


B= 


s 


1AE—B= A A (12) 


Si agregamos ahora a las células de una columna cualquiera de la matriz 
(12) las células de otra cualquiera de sus columnas muitiplicadas por una 
«matriz arbitraria S, esta operación equivaldrá, obviamente, a una serie de 
transformaciones elementales de tipo 1l o IV realizadas con la matriz A£—B, 
de modo que el resultado será una matriz equivalente a AE—B. Tengamos en 
cuenta esta observación y reallcemos sucesivamente las siguientes translorma- 
ciones con la matriz A£—B: agreguemos a su primera columna la segunda 
columna multiplicada por P; agreguemos a la primera columna de la matriz 
nueva su tercera columna multiplicada por P?, a su segunda columna la tercera 
multiplicada por P, etc. Después de estas transformaciones obtendremos la 


1) Hablando más generalmente, al caso de cualesquiera cuerpos conmutati- 
vos perfectos. Pero entonces, en lugar del cuerpo de los números complejos 
habrá que tomar la adherencia algebraica del cuerpo conmutativo correspondiente. 


12 * 


180 Cap. IV. Matrices polinomiales 


matriz 


o —E 0 0 
0 0 —=£ 0 
o o” O 2. =E 


0 A 
pa pa=1 par.  P 


Agregando ahora a la última fila la primera, la segunda, .., filas multiplica- 
das, respectivamente, por P*%-1, Pr=3, .,, y cambiando el orden de las co- 
lumnas, obtendremos la matriz 


—E 


il A (13) 


Puesto que la matriz (13) tiene la forma celular diagonal y sus células iniciales 
coinciden, salvo el signo, con matrices unidades, resulta que los divisores ele- 
mentales de la matriz (13) coinciden con los divisores elementales de Ja matriz 
pm=(A£ — Ay" que pasamos ahora a examinar. 

Por hipótesis, el pen característico de la matriz A es igual a e (A) y 
es irreducible sobre el cuerpo conmutativo K. De aquí se desprende que todas 
sus raíces en el cuerpo de los números complejos son diferentes y que, por con- 
siguiente, existe una matriz compleja T tel que TAT-=1 es de forma diagonal 
y que 
A—G1 


AETAT-1= 


A—G 


La matriz P* es equivalente a la matriz TP*T-1=(TPT-% y la última es 
de la forma 


(4 —a)" 
[TOE=A)T-19=(ME=TAT-19= “a 
(A—a,)" 


Por esto, los divisores elementales de la matriz P"* en el cuerpo de los núme- 
ros complejos son iguales a (A—aAy)*, ..., (A—2,)”. Todos ellos pertenecen a 
dilerentes polinomios irreducibles. Los factores invariantes de la matriz PM son 
hh... 1, A—a1M”...(A—aG,)” = (2 (4)]%. Pero el polinomio e (A) es irreducible 
sobre el cuerpo conmutativo K y, por consiguiente, la matriz AE—P* tlene en 
este cuerpo conmutativo sólo un divisor elemental, a saber, (e (4)]%. Es decir, 
la matriz no y con ella también la matriz (12) tienen sólo un divisor elemen- 
tal fe (4))". Hemos demostrado el tema. 

Si A es la matriz asociada de e(A), diremos que ta matriz B es la célula 
generalizada de Jordan correspondiente al divisor elemental (s (4))”. Asimismo 
diremos que una matriz tiene la forma generalizada de Jordan, sí se descom- 
pone en células generalizadas de Jordan. Está claro que una matriz generali- 
zada de Jordan se determina plenamente por sus divisores elementales. 

TEOREMA 6. Toda malriz A formada por elementos de un cuerpo conmuta- 
tivo K se reduce sobre este cuerpo a la forma generalizada de Jordan. Está forma 
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ueda determinada por la matriz A univocamente, salvo el ordn de disposición de 
as células a lo largo de la diagonal principal. 

En efecto, sean [8 (A), ..., (2, (4)]”* los divisores elementales de la ma- 
triz AE—A en el cuerpo conmutativo K. Construyamos para todo polinomio 


Je; (4))”* la correspondiente célula generalizada de Jordan B; y consideremos la 
mata celular diagonal B con Jas células B, a lo largo de la diagonal prin- 
cipal. 

En virtud del lema 4, los divisores elementales de la matriz A£—B son 
iguales a los respectivos divisores elementales de la matriz AE — A. Puesto que 
AEB y AE—A son, además, del mismo rango y del mismo orden, resulta 
que A es semejante a B. La unicidad se deduce de que los divisores elementa- 
les de la matriz A£— A determinan univoramente la matriz B 

Si el campo principal K es cuerpo de Jos números complejos, todos Jos 
polinomios irreducibles son del primer grado. Por consiguiente, las matrices 

8 de las células generalizadas de Jordan serán del primer orden, de mado 
que las células generalizadas se convierten en las células corrientes de Jordan. 

Consideremos también el caso en que el campo principal K es el cuerpo de 
todos los números reales. Los polinomios irreducibles sobre K serán de dos tipos: 
1) polinomios de primer grado A—p, las respectivas células generalizadas de 
Jordan serán células corrientes de Jordan y 2) 8(4)==424+ pA4-q, donde 
p3—47 < 0; la célula asociada A es de la forma 


[4 e] cu 


Pa célula generalizada de Jordan correspondiente a (414 pA+4-q)? tiene la 
orma de la matriz 8 del lema 4, donde en lugar de A se puede tomar una 


matriz de otro tipo 
[8 2) 


a y B son los coeficientes de la parte real y de la parte ir respectiva- 
mente, de la raíz compleja del penemo 114. ph 4q. Esta sustitución es posible, 
ya que el polinomio característico de la matriz 


AA 
MEA [5% TÉ 
es igual a 11+pi4q. 
Ejemplos y problemas 


l. Determínese cuáles de las matrices 


3 l — 42 130 25 2 t 1 
4 —2 6|, [- 8 - A — : 74 —22]|, 


a 1] 22 —27 —9% -—36 í—1 3 


son semejantes. Hállense sus matrices de Jordan semejantes. 

2. Demuéstrese que el polinomio característico de una matriz A es igual al 
producto de todos los factores invariantes y que el polinomio minimo cs ¡igual 
al último de Jos factores invariantes de la matriz característica AE —A. 

ñ 3. gil los polinomios mínimos de las matrices indicadas en el pro- 
ema l, 


-— 2 
8 —13 156 20 —89 —32 2 00 
|- 8 18 —22|, E — 51 2 y F ] 
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4, Demuéstrese que sobre el cuerpo de los números complejos toda matriz 
cuadrada es semejante a una matriz diagonal si, y sólo si, su polinomio minimo 
no tiene raices múltiples. 

5. Demuéstrese que las matrices seciprocamente transpuestas A y A” son 
dd: semejantos. 

. Si A es una matriz regular y B es una matríz cualquiera, la matriz AB 
es semejante a la matriz BA. ¿Serán semejantes AB y BA siendo arbitrarios 
las matrices A y B? 

7, Hállense las formas normales de las matrices 


| 22 9 -a1| NE 
$ 0 3 l-]1-] 


sobre el cuerpo de los números racionales, sobre el cuerpo de los números reales 
y sobre el cuerpo de los números complejos. 

8. Muéstrese que para obtener la forma normal sobre el cuerpo de los 
números complejos se puede tomar en lugar de las células de Jordan células de 


tipo 
pa0...00 
pa ...00 
p ...00 ] 
pa 
p 


donde a es un número fijo cualquiera diferente de cero, : 


9. CARACTERISTICA DE SEGRE Sea A una aplicación lineal de un cs: 
pacio vectorial complejo y sean pi, ..-. Ps distintos valores propios de esta 
aplicación. Indiquemos por 0jj, U2p, -.., Oj los Órdenes de las células 
de Jordan en la forma norma! de Jordan "de .4, correspondientes al vaior 
propio pa. El símbolo 


Í(O11, Oro...) (033, O2g, --.) -.- (015, Ops, <>») 
se denomina característica de Segre de la aplicación yf. Por ejemplo, las matrices 


1] 21 210 2]100 
0 1 02 21 210 
A E 21|- 2 y 2 1 
2 02 3 2 


tlenen, respectivamente, las siguientes características de Segre: ((2,1) (1), 
((2,2)), ((3) 1) y [(4)]. Calcúlense las caracteristicas de Segre de las matrices 
indicadas en el problema 1. 


10. CARACTERÍSTICA DE WEYR. Sea y la misma aplicación del problema 
anterior. Indiquemos por 
Ci Ri Or + A la. “Op 
los defectos de las aplicaciones .4=p8, (A—p8Y, ..., (ui —p¡EY”, donde p 
es la multiplicidad del valor propio p;. La fila (A. Aya, -.., Ap) Se denomina 


caracteristica de Weyr de la aplicación A correspondiente al valor propio p,. 
Demuéstrese que las características de Weyr de las aplicaciones indicadas en el 
problema 9 son iguales, respectivamente, a 


((2, 1), (09), 142, 291 (41, 1,1) GU) y (1, 4, 1 1]. 
11. Demuéstrese que la característica de Segre y la característica de Weyr 
correspondientes a un mismo valor propio están relacionadas del modo siguiente. 
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Supongamos que la característica de Segre es (6, 4, 3, 3). Consideremos el dia- 
grama de puntos 


El número de puntos en las sucesivas columnas de este diagrama será precisa- 
mente la característica de Weyr. Para el caso considerado es igual a (4, 4, 4, 
2, 1,1). 

12) Toda matriz con divisores elementales irreducibles se denomina semí- 
simple. Demuéstrese que cualquier matriz A puede ser descompuesta en la suma 
de una matriz semisimple y otra nitpotente permutables entre sí y que esta 
descomposición es única. 
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En este parágrafo serán considerados aquellos problemas del cálculo 
de matrices en la solución de los cuales se emplea la posibilidad de 
reducir las matrices a la forma normal de Jordan. De acuerdo con 
esto se aceptará que el campo principal es el cuerpo de todos los 
números complejos. 


16.1. Polinomio en una matriz de Jordan. Las funciones de ma- 


trices más sencillas son los polinomios. Más tarde daremos la defi- 
nición general de función de una matriz, mientras que ahora dare- 
mos la expresión explícita de un polinomio en una matriz que tiene la 
forma normal de Jordan. Consideremos primero una célula aislada 
de Jordan de orden n ; 


pro0. 90 
pl1...00 

A=| ———- ....... : (1) 
pel 
Pp 


Demostremos que para cualesquiera valores naturales de m es válida 


la fórmula 
pr (7) pr... lejezgo) pana 


A” = p ds (8) pa=res 1]. (2) 


donde se ha tomado 
(7) mim—)) ... (m—k+1) 
RETABLO 
El método de demostración más sencillo es por inducción se- 
gún m. Para m=|l| la fórmula (2) coincide con (1) y por lo tanto 
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es verídica. Por otro lado, si la igualdad (2) es válida para un 
valor de m, multiplicándola por A, obtendremos, mediante el cálculo 
directo, que la fórmula (2) es también válida para A"+!, 
Sea ahora f (A) un polinomio en A: 
[0)=a2 +20 Ata As. 
Tenemos, por definición, 
HA) =a. Ea, A+ UA... +04. 


Introduciendo aquí en lugar de las matrices A” sus valores de (2), 
veremos que en la ¿-ésima fila y en la (1 +s)-ésima columna de la 
matriz f(A) aparece la expresión 


k 
E A po=5 fo (p). 


$ 
muo0 


Por consiguiente, obtenemos definitivamente que 
FO) FE) 00) poto) 
HA)= Ho O rt le 


a Ho) - 


Hemos calculado el valor de un polinomio en una célula de Jordan. 
Pero una matriz general de Jordan A es una suma directa de célu- 
las aisladas de Jordan: 


ASAFA JR... +4, 
y según el p. 1.4 tenemos 
HA) HAYS HAYA... HA). (4) 


Aquí f(A,), ... f(A4,) son polinomios en células aisladas de Jordan 
y sus expresiones vienen dadas por la fórmula (3). Este resultado 
se puede aplicar también para el cálculo de polinomios en matri- 
ces Á que no tienen la forma de Jordan. En efecto, determinamos 
primero una matriz T tal que la matriz T-*AT =B tenga la forma 
normal de Jordan, calculamos después f(B) empleando las fórmu- 
las (3) y (4) y, finalmente, teniendo en cuenta la relación 


f(A) =H(TBT=*") =Tf(B) T-1 
(p. 3.1) obtenemos el valor de f (A). 


16.2. Funciones escalares. El concepto general de funciones ma- 


triciales se define de la misma forma absolutamente que el concepto 
de funciones numéricas corrientes. Á saber, considerernos un conjunta 
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de matrices Mt. Si a toda matriz 4 de Wi se pone en correspondencia 
una matriz B, se dice que B es una función de A definida sobre Mi. 
Queremos ahora poner en correspondencia a toda función numérica 
corriente p =f (A) —que está definida sobre un conjunto de números 
complejos y que satisface las condiciones indicadas más abajo— una 
determinada función matricial (A). Esta correspondencia se obtiene 
del modo siguiente. Sean dadas una función numérica p=f (A) y una 
matriz arbitraria Á. Indiquemos por P,, Pz, -.-, Ps los diferentes 
valores propios de la matriz A. Reduzcamos AÁ a la forma normal 
de Jordan 


TAAT=B=B,+B,+...-+B,, 


donde B,,..., B, son células de Jordan, y consideremos una de 
estas células, por ejemplo, la célula 


Fo, 1 0...07 
E (5) 
¡2 PL 


que corresponde al divisor elemental (A—p,)w. Si la función f(A) 
está definida en una vecindad del punto p, y tiene derivadas finitas 
Flo), ..., f—D(p;¡), tomamos por definición 


Hey qn + ate) 


FB, == HO) ... Aaa (Pn |. (6) 
Í (0) 

Además, si f (A) está definida en una vecindad de cada uno de los 
puntos p,, ..., Ps y tiene en estas vecindades derivadas de orden 

adecuado, tomamos también 
FB)=HBIFHBIE---FÍB) (7) 

y 

HA)=Tf(B)T"" =T(HBI+ >... +[(B,/)T=". (8) 


La matriz f(A) se llama valor de la función f(A) para 4= A. Más 
abajo se demuestra que f(A) no depende de cómo se reduce la 
mátriz A a la forma normal' y es, por consiguiente, una función 
matricial de A. Esta función se denomina correspondiente a la fun- 
ción numérica f(A). Está claro que no todas, ni mucho ntenos, 
funciones matriciales poseen las correspondientes funciones numéricas. 


1 Es decir, de cómo se escoge la matriz T. 
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Aquellas para las cuales existen funciones numéricas correspon- 
dientes se denominan funciones escalares. 

Indiquemos algunas propiedades elementales de las funciones 
escalares: 

A) Si F(A) es un polinomio en A, el valor de la función escalar 
f(A) coincide con el valor del polinomio f(A) para A= A en el 
sentido del p.1.2. 

Efectivamente, la propia definición de las funciones escalares se 
ha realizado de modo que, para el caso de polinomios, coincida 
con la antigua. 

B) Sea A una matriz y sean f, (A) y f,(A) unas funciones nu- 
méricas para las cuales tienen sentido las expresiones f, (A) y f, (A). 
Si (a) =H0)+Í (2), también F(A) liene sentido y [(4) =f,(4)+ 
+ 


Ji 

C) Si A es una matriz, f, (A) y f,(A) son unas funciones numé- 
ricas tales TE FL(A) y f,(4) tienen sentido y si f(A)=f, (A) f, (A), 
también F(A) tiene sentido y (A) =f,(A)f, (4). 

Las demostraciones de las propiedades B) y C) son semejantes 
y por ello nos limitaremos al caso de la propiedad C). Para calcu- 
lar los valores f,(A), f,(A) y f(A) debemos, por definición, reducir 
Á a la forma normal de Jordan emplear las fórmulas (7) y (8). 
Si se logra demostrar que HB) [BA de la fórmula (8) 
resultará directamente que f (4) =f, (4)f, (4). Por otro lado, se tiene 

HB)=f(B) +7 (B,) + ... +/(B,), 
FB (B0=f(BI)f.(BJ)+...+f, (B)f,(B,) 


y, por consiguiente, todo se reduce a Ja demostración de las igual- 


dades 
[(B)=f (B)h (Bi) (i=1, 2, ..., £, 
donde B, son células de Jordan. Tomando los valores de f,(B;) y 
f.(B,) según las jórmulas (6) y multiplicándolos, veremos que en 
la £-ésima fila y en la (k + /)-ésima columna de la matriz f,(B,)f,(B,) 
aparece el elemento igual a 
LO) OA AA APO. + 5H 0): hato). 
Esta expresión puede ser representada en la forma 
7 [r, (0)Í0 (0) + A CI A ETA (_)] 


que, de acuerdo con la regla de la derivada de un producto de fun- 
ciones, coincide con pb (p). Por consiguiente 


[,1(B)f,(B)=1 (81) 
y la proposición C) queda demostrada. 
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Análogamente, empleando esta vez la regla de la derivación de 
una función de función, se podría demostrar que siendo y (A) y f (y (4) 
funciones numéricas que satisíacen las condiciones en las que la 
expresión f(p(A)) tenga sentido y siendo p(A) =f (p(A)) se tiene 
Yy(A) =f(p(A)). 

D) Sea A una matriz cuyos valores propios son P,, Pa, -..» On 
con la particularidad de que todo valor propio aparece aquí tantas 
veces como su multiplicidad lo indique. Si f(A) es una función 
numérica y si f(A) tiene sentido, los valores propios de la matriz 
Í de son iguales a f(p,), f (Pa), ..., fp). 

n efecto, los valores propios respectivos de las matrices f(A) 
y TUF(A)T =f(TP AT) coinciden y, por lo tanto, podemos aceptar 
que A tiene la forma normal de Jordan. Las fórmulas (5) y (6) 
muestran que en este caso f(A4) tiene la forma triangular con la 
particularidad de que a lo largo de la diagonal principal de f(4) 
figuran los números f (p,), He, -.., (Pr). Puesto que los elemen- 
tos diagonales de una matriz triangular son sus valores propios, la 
proposición D) queda demostrada. 

Consideremos dos ejemplos. 1) Sea f(A)=4”!. Esta función está 
definida en todo punto, salvo A=0, y para todos los valores de A 
diferentes de cero tiene derivadas de cualquier orden. Por consi- 
guiente, si la matriz A no posee valores propios nulos, es decir, 
si A es regular, resulta que 10 tiene sentido. Pero A-f(A)= 1 
y por lo tanto A-f(A)= E, de donde tenemos f (4) = A”!. Es decir, 
a la función A”! le corresponde la matriz inversa. 

2) Sea f(4)=V A. Para 40 esta función tiene derivadas finitas 


de cualquier orden. Por consiguiente, la expresión Y A tiene sentido 
para todas las matrices regulares A*”. Tomando A=A en la 


relación 
FAA) =4 
HAJF(A) = 4. 


Hemos demostrado, por consiguiente, que de toda matriz regular se 
puede extraer la raíz cuadrada. 


16.3. Representación de los valores de funciones por polinomios. 
En todos los cursos del Algebra superior se considera el problema 


de cómo a partir de un sistema dado de números diferentes p,, Pa, 


obtenemos 


..., Ps y de otro sistema cualquiera de números %,, %o, ..., %; 
obtener un polinomio fF(A) que en los puntos p,, Ps, ..., Ps tome 


1) Para evitar la multilormidad de MÁ y hacer más rigurosos los razona- 
mientos, es Suficiente efectuar en el plano complejo de la variable 4 un corte 
desde el origen de coordenadas a lo largo de un rayo que no contenga ninguno 
Pee valores propios de la malrlz A y considerar sólo una de las ramas del 
radical. 


188 Cap. IV. Matrices polinomiules 


los valores %,, %,, ..., %,, respectivamente. La solución se ofrece 
en forma del conocido polinomio de interpolación de Lagrange. 

En lo sucesivo será importante saber constriur los polinomios 
cuando tanto ellos como sus derivadas hasta un orden determinado 
toman los valores dados en los puntos p,. Ps» ..-» Ps. Este problema 
es, por consiguiente, una generalización directa del problema ante- 
rior. Enunciernos la proposición referente a su solución en forma de 
un lema especial. 

LEMA. Sean P,, Pa --.» Ps unos números diferentes dados y sea 
dada una tabla de (R+1)s números cualesquiera a;,. Existe un poli- 
nomio p(A) que en todo punto p, toma el valor a,, mientras que su 
j-ésima derivada toma el valor a, (i=1, 2, ..., s; J=1, ..., K). 

Primero conviene construir un polinomio auxiliar p.0) que tanto 
él como sus derivadas hasta el orden R tomen los valores requeridos 
solamente en el punto p, y se anulen en los demás puntos. Tomemos 


(A) = Bio + Bi, Ap) + e... +Bia Ap), 
D¿(A) = (APA AAA AA AÑ 42, 
p (A) =,(4)0,(4), 
donde By. Bj,» -.., P¡s son unos números por ahora indeterminados. 
Es evidente que para cualesquiera valores de Bo, ..., B;s se tiene 
pie)=».(0p=...=pP(p)=0 (13€). 
De acuerdo a la regla de la derivación de un producto tenemos 


pp) =P (0) 0D, (0) + 107" (ENO (PH. +9, (p;) D;” (p,), 
es decir, 


a= 1BJD EN F IAB Doo +. + Bio Df” (p/). (9) 


Como 0, (p¡) 7 0, tomando /=0, l, ..., + podemos determinar de 
las relaciones (9) sucesivamente los números Bo, B;,, ---. Bya y, con 
ello, calcular p,(A). El polinomio 


PA) =p, (A)IHPLAIA Hp lA) 


satistará, obviamente, las condiciones del lema. 

Consideremos una función numérica f(4) y una matriz A tal que 
el valor f(A) esté definido. Probemos que existe entonces un poli- 
nomio p(A) tal que p(4) es Igual a F(A). Indiquemos por p,. P,» 

. -, Ps los distintos valores propios de la matriz A. Sea n su orden. 
De acuerdo con el lema que acabamos de demostrar podemos con- 
struir un polinomio p(A) que satisfaga las condiciones siguientes 


plo =ftp0), »Dlr)=Fi0). -... DY 4) <=" (p) (10) 
(i=)1, ..., $). 


to Si algunas de las derivadas [Y?(p¿) sobran para la determinación de / (A), 
Jos números correspondientes de (10) pueden ser sustituidos por ceros. 
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Para determinar el sentido de la expresión f(A) sólo necesitamos 
conocer los valores que toman en los puntos p,, Ps, -.-. Py, la función 
F(A) y sus derivadas hasta el orden n—1 a lo sumo. Puesto que 
estos valores de f(A) y de p(A) coinciden, resulta que f(A) = p(A). 
Es decir, hemos obtenido el siguiente resultado: 

TEOREMA 1. Los valores de todas las funciones escalares de una 
matriz A pueden ser representados mediante polinomios en A”, 


En particular, considerando la función f(A)=MWÁ vemos que 
para toda matriz regular A existe un polinomio p(A) tal que 


PA) p(A) = A. 


Empleando el teorema 1 es fácil resolver el problema que hemos 
dejado pendiente en el punto anterior acerca de la unicidad de la 
determinación del valor de f(4). En efecto, conociendo los valores 
de la función f(A) y de sus derivadas en los puntos p,, ..., Ps, po- 
demos construir el polinomio pu cuyo valor p(A) no depende de 
cómo se reduce la matriz A a la forma normal de Jordan y coin- 
cide, al mismo tiempo, con el valor f(A). Es decir, el valor f (A), 
definido en el punto anterior mediante la reducción de la matriz A 
a la forma normal, no depende de cómo se realiza esta reducción. 

Hagamos una observación más. Sea f(A4) una función numérica 
y sea A una matriz tal que f(4) tiene sentido. En virtud del 
teorema 1 podemos hallar un polinomio p(A) tal que p(4A)=f(4). 
Dada la función f(A), el polinomio p(A) depende sólo de los divi- 
sores elementales de la matriz A. Pero los divisores elementales de 
la matriz A y de la matriz transpuesta A” coinciden y, por ello, 
se tiene p(A”) =f(A”). Es fácil deducir del punto 1.3 que p(A') = 
== p(Ay. Es decir, para toda función escalar f(A) tenemos f(A") =[ (Ay 


16.4. Divisores elementales de funciones. Estudiemos el problema 


de cómo determinar a partir de los divisores elementales de una 
matriz A los divisores elementales de una de sus funciones escala- 
res Ff(A). Reduzcamos A a la forma normal 


TAAT=B=B,+8B,+...+B, (11) 
donde B,, ..., B, son células de Jordan. Por definición, 
FA) =T[(B)T-" 


y, por consiguiente, los divisores elementales de las matrices f (4) 
y f(B) coinciden. De (11) se desprende que 


HB)=HBI+HBJI+... +/(8Bp; 


1) Notemos una vez más que, según los razonamientos expuestos en el texto, 
todo valor f/(A) de una función escalar f dada se puede representar mediante un 
polinomio p(A). Sin embargo, para una misma función f este polinomio será 
diferente, según sean diferentes las matrices Á. 
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luego, el sistema de los divisores elementales de la matriz f(B) 
es la unión de los sistemas de los divisores elementales de las células 
HB.,), .-..f(B;,). Es decir, nuestro problema inicial se reduce al 
siguiente: dada una célula de Jordan B, de divisor elemental 
(A—p,)" haltar los divisores elementales de f (B.,). 

En virtud de las fórmulas (5) y (6) tenernos 


¡Foo —F (00)... am puu= 1 (pj) 
AE /H(B)= AF (00) — 3 A? (e) - (12) 


e .  .P. . . . 6... q2 o. .. 


Determinemos los máximos comunes divisores D, (A), D,(A), 
«., Dpa,(A) de los menores de primero, segundo, ..., ¿-ésimo orden 
de esta matriz. El mayor de ellos D,,(?) es igual al determinante de 


la miatriz, es decir, 
Da, (0) = (A Hppyr. 


Todos los demás son divisores de D,,(A) y, por consiguiente, son 
de la forma (A—f(p;))”. Consideremos D,,-1 (A). Este polinomio 
debe ser un divisor de todos los menores de orden n,—1 de la 
matriz (12) y, en particular, del menor Á (4) que se obtiene supri- 
miendo la primera columna y la última fila. Sin embargo, si en 
este menor se introduce en lugar de A el número f(p;), se obtiene 
una matriz de forma triangular y con los elementos —f' (p;) a lo 
largo de la diagonal principal y, por consiguiente, 


Ale) =(—f (opy"”". (13) 


Supongamos ahora que f' (p,)>+ 0. La igualdad (13) muestra enton- 
ces que Á(A) no es divisible por ¿—+f(p;). Pero el polinomio 
D,,-1(4) debe ser un divisor común de los polinomios A (A) y D,, (A), 
es decir, Da,-1 (A) == 1. Los demás polinomios D,,-2(A), ... D, (A), 
D,(A) son divisores de D,,.1(A) y, por ello, también son iguales 
a la unidad. Calculando los cocientes D,+,:D, vemos que los facto- 
res invariantes de la matriz (12) serán 1, ..., 1, (A—f(p)))”*, debido 
a lo cual la matriz (12) tendrá sólo un divisor elemental (A — f (p;))*:. 
De aquí se desprende el teorema siguiente: 

TEOREMA 2. Sea A una matriz de valores propios p,, ..., P, 
y sea [(4) una función tal que (py) +0 (¿=1, ..., s). Entonces, 
si la matriz f(A) existe, sus divisores elementales se pueden obtener 
sustituyendo cada uno de los divisores elementales (A—p,)"! de la 
matriz A por la expresión (4—f (p,))". 

Por ejemplo, si A es una matriz regular y f(?.)=1A”!, se tiene 
f(4)=A"”* y F (e) =—er* 0. Luego, si sustituimos todo divisor 
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elemental (A—p,)"* de la matriz A por la expresión (A—p7')", 
obtendremos el sistema de divisores elementales de la matriz inversa. 


El teorema 2 permite determinar los divisores elementales de la matriz 
[ (A) pertenecientos a aquellos valores propios [ep para Jos cuales f' (p¡) 4 0. 
No es difícil obtener la regla correspondiente también para el caso en que 
f' (pi) ==0. Supongamos que para un valor propio de una matriz A se tiene 


Prop=P(p)=...=/-D(p)=0 y [WM (p¡) 20. (14) 


Queremos determinar en qué divisores elementales de la matriz f (A) se trans- 


forma cada uno de Jos divisores elementales (A—p;)”! de la matriz A. Es obvio 
ue este probiema se reduce al siguiente: determinar los divisores elementales 
e la matriz (6) en la condición (14). Para k==n; la matriz (6) resulta diago- 
nal y sus divisores elementales serán A—f(pp, .... A—f (pj). El caso k=1 
ha sido examinado anteriormente: en este caso la matriz (12) tiene un único 


divisor elemental (A—f(p¡)*W. Por esto sólo mos interesarán los valores de k£ 
comprendidos entre 1 y n;. 
Consideremos un espacio lineal auxiliar € de dimensión rn, y de base ay, 


la ..-» 67, Pongamos para abreviar q 19 (Pp) ==», y ni¡=n e indiquemos 
por $ la aplicación lineal del espacio Q que tiene la matrtz 

C=/f (Bi —f (pi) Es. 
Tenemos, por consiguiente, 


AMÉ — <Q +j0qrr Pp ls > + + glo 


a6' = TI 

a A a e e... ... .. ........0... 0.0... (15) 
Un-16 = Uan 

ae =0 (1 > n—*k) 


Puesto que nos interesan los divisores elemantales de la aplicación $£, tomare- 
mos en f otra base en la que la matriz de la aplicación $ tenga una fornru 
más sencilln. Sea 


e=BO + Bis PB (l=1, ..., 2); 
entonces 


eE =Bi¡Garitira e Lar HO +10 1) Cra > 
Escojamos los números f;¡y de modo que se cumplan las relaciones 
eE =Ci+k e B=0 lll, ..., a—k; | > n—k). (16) 
Esto ofrece el sigulente sistema de ecuaciones respecto de Py: 


rr Pi Bier, ro Carr ri hr Be rro > 


Teniendo en cuenta la condición %z+, % 0, de aquí se pueden determinar suce: 
sivamente los valores fij¡, fij, ¿+19 ---. expresándolos en términos de los valores 
de f con mayor primer indice. Para los valores Bj, donde ¿=Bn=—kR, no se 
obtiene ninguna ecuación, de modo que estos valores se pueden escoger arbi- 
trariamente. En particular, tomando Bj. kx n-1=>»»» =Ban =1, obtendremos para 
los demás coeficientes iniciales Pri, .... Bn=kr1,nokr+r Valores nulos. Las 
ecuaciones (15) pueden ser. resueltas entonces respecto de ay, a, ..., Gp; por 
csto el sistema €, €q. +...» €, Será una base nueva de Y que satisface las 
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condiciones (16). Descompongamos Jos vectores €, ..., €, en los sistemas 
€1. €1+» €1+2k»> e...» 
la C++ C2+eRr» -->- 


€ €xk» lak» e... 


y consideremos los subespacios L,, ..., Up. tendidos sobre estos sistemas. Las 
relaciones (16) mucstran que £, es un subespacio Invariante de base €;, €;+k, 
€i+ok «»- Y que 


L=2,+l.+...+2x (17) 


En virtud de los resultados del p. 12.3, de aqui se no prents que la matriz 
de la aplicación $ se descompone en K células de Jordan de divisores ele- 
mentales 2%», 179, .,,, A", donde m;,, Ma, ..., my son las dimensiones de 
los subespacios (f,, Ly, -.., lp. La matriz de la aplicación inicial f(B¡) está 
ligada a la matriz C mediante Y fórmula f(B)=f (pp) E¿+C y, por lo tanto, 
los divisores elementales de la matriz f(B;) son (Af (NY, .... AFP. 
Si empleamos el símbolo [a] para indicar el mayor número entero que no sobre- 
pasa a a, obtendremos para my, ..., ma las expresiones sigulentes: 


_[Fn—! n—2 n—k An 
0 [Jet me [E] 00 me [252] 0 (5). 
Por consiguiente, sí la matriz A tiene un divisor elemental (A—p)2 y si 
Fip)p.. =fX=D(p):0 y fp) 0, entonces al pasar de A a f(A) este 
divisor elemental se descompone en los divisores elementa'es (Af (py", ... 
coo (Af (pp), donde 


m= (| +1. m= [22] +, Lo. Mya EJ 


Consideremos un ejemplo. Supongamos que Á tiene los divisores elementales 
(A — y 7 (A + 2)*; es preciso determinar los divisores elementales de la matriz 
A—3AY3A2—E. En estas condiciones tenemos f (7) mu 40 — 3444-3131 = 
= (A— 1) (14-19, (22) %0, F (1)=f"(1)=0 y f" (1) 40. Al pasar a F (A) 
el divisor elemental (A+ 2)4 se convierte en (A —f (—2))? = (4 — 27)*, mientras 
que cl divisor elemental (A— 1)% se descompone en 43, 43 y 43. Por consigul- 
ente, Jos divisores elementales de la matriz f(A) serán 49%, 4%, 4 y (A — 27). 


16.5. Series de potencias. Una sucesión de matrices cuadradas 


As» Áa, ...» Ám» Ám+10 ... (18) 


de un mismo orden se llama convergente hacía la matriz A, sl los elementos 
de las matrices (18) que aparecen en la intersección de una columna y de una 
fila dadas convergen hacia el elemento correspondiente de la matriz A. De esta 
definición se desprende directamente que sí las matrices Aj y Bm convergen 
con el crecimiento de m hacia A y 8, respectivamente, las matrices A, +8 
y AxmBm convergen hacia A+-B y AB. En particular, si 7 es una matriz 
constante y la matriz A, converge hacia A, resulta que T"1A¿T tendrá como 
limite a la matriz TA, Además, si 


Apr AP RARA AR (mal, 2, ...), 


donde los ordenes de las células no dependen de m, la matriz A, converge con 
el crecimiento de m hacia un límite determinado si, y sólo sl, cada una de 


las células AD converge hacia un límite. 
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La última observación permite resolver fácilmente el problema de conver- 
gencia de las así llamadas series de potencias de matrices. Ses 


La A Paid... (19) 
una Serie formal] respectu de la variable 4. La expresión 
2) E + a A+ a A+... Fan A MR... (20) 


se llama serie de potencias correspondiente de la matriz A y el polinomio 
HA)=A ERAS... 4% ÁS 

se llama n-ésima suma iniclal de esta serle. Se dice que la serie (20) converge, 

si la sucesión de las sumas iniciales f,(A), .... fm(A), ... tiene límite; en 


el caso de su existencia este límite se denomina suma de la serie (20). 
Reduzcamos la matriz A a la forma normal 


T-14AT=BmB,+8,+...+8Bp 


donde B,, ..., B, son células de Jordan. Hemos visto más arriba que la con- 
vergencia de la sucesión fp (A) equivale a la convergencia de la sucesión 
re ¡pe (A)T (mul, Ze AS E Pero 


TA (A) T =p (TA AT) J (B)=f A (BYR-- ba (B), 


es decir, el problema acerca de la convergencia de la serie (20) equivale al 
siguiente: ¿bajo qué condiciones converge esta serie para las células de Jordan 
Bw ..., Bs? Consideremos una de estas células, por ejemplo, la célula Bj. 


Sea (1A—p¿*! el divisor elemental que le corresponde. Según la fórmula (3) 
tenemos 


im 101) qn (0) ... mm pa D (pp) 


1 al 
Fa (B1) = Em (Pp) ..- (ni —2)1 pl 2 (op, , 


L Fm (01) 


por consiguiente, fm (8B¿) converge hacia un límite con el crecimiento de m si, 
y sólo si, fm (Pi). Fm (Pid .-.» [=D (pp convergen hacia unos límites, es 
decir, si en el punto fp, convergen tanto la serie (19) como las series que se 
obtienen de ella derivándola término por término n¡—]1 veces sucesivas. De 
la teoría de las funciones analíticas se sabe que todas estas series convergen 
indudablemente, sí fp, pertenece al Interlor del círculo de convergencia de la 
serie (19) o si el e a la circunferencia del círculo de convergencia y 
la (n;—1)-ésima derivada de la serie (19) converge en el punto p;. Es decir, 
hemos demostrado el teorema siguiente: 

TEOREMA 3. Pura que una serie de polencias de una malriz A converja es 
necesario y suficiente que todo valor propio p; de la mutríiz A se halle en el 
interior del círculo de convergencia de la correspondiente serie de potencias [ (A) 
o que se halle sobre la circunferencia del circulo de convergencla, pero con la 
particularidad de que la serie, que se obtiene derivando n¡—1 veces la serie de 
f (4), converja en el punto p;¡, donde n, es el grado del mayor divisor elemental 
correspondiente a p;. : 


16.6. Matrices conmutables con una matriz dada. Dos matrices 
A y B se llaman conmutables, sí AB=BA. Toda matriz es con- 
mutable con sí misma y con la matriz unidad. Además, si A es 


131843 
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conmutable con las matrices B y C, Jas igualdades 
A-BC=BAC=BC-A, 
A(aB+$C) =aAB + BAC =aBA + BCA =(aB +BC) A 


muestran que A es conmutable con el producto y las combinacio- 
nes lineales de las mismas. Luego, si B es conmutable con A, 
resulta que B es conmutable con cualquier polinomio en A. En 
particular, A es conmutable con los polinomios en A y cualesquiera 
dos polinomios en A son conmutabtes. 

Según el p. 16.3, los valores de las funciones escalares de una 
matriz A pueden ser representados mediante polinomios en A. 
Los polinomios en A son conmutables con toda matriz B que sea 
conmutable con A. Por consiguiente, el valor de toda función esca- 
lar de una matriz A es conmutable con todas las matrices que son 
conmutables con A. 

La relación aE.P=P.aE muestra que las matrices aE son con- 
mutables con todas las matrices del mismo orden. La reciproca tam- 
bién es válida: 

Si una matriz cuadrada A de orden n es conmutable con todas 
las matrices de orden n, la matriz A es de la forma aE. 

Indiquemos por «;, los elementos de la matriz A. Sea P la 
matriz que contiene la unidad en la p-ésima fila y en la qg-ésima 
columna, mientras que todas sus demás posiciones están ocupadas 
por ceros. Realizando la multiplicación directa obtenemos 


Do 2, 0 FO Or... 0 
AP S Ap i y PA=|%, Ga E 
p0 np . 0 0 0 0 


donde aparecen escritas la q-ésima columna de la primera matriz 
y la p-ésima fila de la segunda. Como, por hipótesis, AP= PA, 
resulte que a,,=0,, Y que «,,=0, si pq. Puesto que p y q 
son arbitrarios, esto significa que A es diagonal y que todos sus 
elementos diagonales son iguales. 

Consideremos ahora un problema más complejo: hallar todas 
las matrices conmutables con una matriz dada A. 

Para resolverlo, reduciremos Á a la forma normal de Jordan 


T>AT=B=B,+B,+...+8B,, (21) 


donde B., ..., B, son células de Jordan. Si la matriz X es con- 
mutable con B, es obvio que Y =TXT”* es conmutable con A y, 
recíprocamente, si Y conmuta con A, también T-*YT = X conmuta 
con B. Por lo tanto, todo el problema se reduce a determinar las 
matrices X que conmutan con la matriz B que tiene la forma 
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normal (21). De acuerdo con (21) descompongamos en células tam- 
bién la matriz AX: 


. . 4... .. _q._._.s)-2- 6 


A O, O 
La condición BX=XB lleva a las igualdades 
B¡XX ¿4 =Xp9Bg (0, q=l, -.., s). (22) 


Vemos que para cada una de las células X,, se obtiene una sola 
igualdad (22) de la cual debemos determinar los elementos de X pe” 
Supongamos que los órdenes de las matrices B, y B, son k y m, 
respectivamente, y que sus valores propios son p y C. En este caso 
X py será una matriz rectangular de k filas y de m columnas. Indi- 
quemos por Eyy (i=1, ..., £; J=1, -.., m) los elementos de la 
matriz X,, y representemos la relación (22) en forma detallada 


“p ) 0 ..o 0 $7 5 .. En 5 Sá cs... O 0 1 0 .... 0 
l pl el EEE [EEE | dsd 
el Lómbm--> End Llra En >>> Ena E 


Realizando aquí la multiplicación y comparando el elemento que 
se obtiene en la f-ésima fila y /-ésima columna del primer miembro 
con el elemento correspondiente del segundo miembro, llegamos a 
las ecuaciones 


Ej H ia En 1 057 (HR, 151). (23) 

Pr =5%, ¡1 + 052, (¿=R, 141), (24) 

PE = Or (=R, ¡=1). (25) 

Si p 0, de (25) se deduce que E, =0; entonces de (24) obtenemos 

sucesivamente Ex =...=ÉEm=0 y de (23) concluimos que todos 

los demás ¿,, son también iguales a cero. Por consiguiente, para 
p 0 tenemos Xy =0. 

Consideremos €l caso p=0. Las ecuaciones (23), (24) y (25) se 

convierten entonces en 


Emmy Er 21 (i=1, ..., 1; f=2, ..., m), (26) 

Es, ¡-1=0 (¡ =2, De m). (27) 

Sea k>m; poniendo €£,,=ÉE, E:=£,» --.» Eim=Em. Teduciremos 
las ecuaciones (26) y (27) a las ecuaciones 
Ey =Bj-0+1 (¿<, 
Ej, == 0 (>) 
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de donde resulta que la matriz X,, tiene la forma triangular lineal 


E En Es >>> En 
kn-| E, Ea -.- cel (28) 


Es En Es --- En 
E $ 


1 2 m-1 
“ looo 0 
¡0.0.0 0 
para va m. Siendo £ < m y tomando Er, m-k 0 


= bn 
«+ Em Ex reduciremos las ecuaciones (23), (24)" y es "a las 
as 


Ey =Eyotentara (i—i2m—k), 
Ey =0 (i—i<m-=—k), 
que significan que la matriz X,, es de la forma 


AS A + 
h=| 00 E Sl 


0...000... E 


Recíprocamente, si las células de la matriz X tienen la forma se- 
ñalada, las ecuaciones (23), (24) y (25) se satisfacen y, por consi- 
guiente, X conmuta con B. 

Por ejemplo, si 


ae o 1] E pI+ 00] (+0), (29) 


las matrices que conmutan con B son de la forma 
Ay A, Uy: de Y 
Zo y: Yo rd AA 
e + > | 


donde ;, Bj, y, y $, son múmeros arbitrarios. 
Este resultado se hace sumamente sencillo para matrices de tipo 


PE, Po E +... +p.E,, donde E,, ..., E, son matrices unidades 
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y todos los números f,, ..., Pp, son diferentes. En este caso las 
células X,, son nulas para pq y X adquiere la forma celular 
diagonal. 

n particular, si B es diagonal y sus elementos diagonales son 
distintos, las matrices conmutables con B son también diagonales. 


16.7. Matrices que conmutan con matrices conmutables. Los po- 
linomios en una matriz Á poseen la propiedad especifica de que, 
además de conmutar con la propia matriz A, conmutan con cual- 
quier matriz X que es conmutable con A. Resulta que esta propiedad 
es caracteristica para los polinomios en A. 

TEOREMA 4. Sí la matriz C conmuta con todas las matrices que 
conmutan con B, C es un polinomio en B. 

Es obvio que basta realizar la demostración para el caso en 
que B tiene la forma normal de Jordan; sea, pues, 


B=B,+B,+...+B,, 


donde B,, ..., B, son células de Jordan. Las matrices auxiliares 
X=0,E,+90,E,+...+a,E,, 
donde a,, ..., «, son múmeros arbitrarios y E,, ..., E, son ma- 


trices unidades, conmutan indudablemente con B y, por ello, las 
matrices X conmutan también con C. De aquí. se deduce, de acuerdo 
con lo expuesto anteriormente, que C se descompone en células: 


CCAA SOS (30) 


además de la condición CB = BC resulta que estas células tienen la 
forma lineal triangular (28). Sea ahora X una matriz arbitraria que 
conmuta con B. La forma general de la matriz X ha sido determinada 
en el punto anterior. Según las condiciones del teorema que estamos 
demostrando, la matriz C debe conmutar con X. Representando X 
en la forma celular veremos que la igualdad CX=*XC equivale 
a las relaciones 


CpA po = XA pgEg (p, q=1,.... Ss). (31) 
Si las células correspondientes B, y B, tienen diferentes valores 
propios, nada resulta de (31) ya que en este caso X,,=0. Por esto 


aceptaremos que los valores propios de las célutas B, y B, coinci- 
den. Sea 


Aj lg ... Q B, PB... Ba 
| dida , 6 Pl 
E: As A 


Supongamos, para concretar, que k<m. Entonces la relación (31) 
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se convierte en 


o EN A > A A AS 
| as e h 00 E... Ea |- 
A e rias dl 


0 
0...05E8 ... En BB. ..-Ba 
-[ OO e | Br... Sl 
A O Ea 


donde E,, E,, ..., €, son números arbitrarios. Multiplicando en el 
primer y en el segundo miembros la primera fila por la última co- 
lumna e igualando los resultados, obtenemos 


Abr +0 2-1 a + 0%, =B E, + Br, + 2... +B451> 


de donde, debido a la arbitrariedad de los números €,, ..., Ez re- 
sulta que 

ay=B,, A=B ---.%.=Be (32) 
Es fácil comprobar que semejantes igualdades se obtienen también 


en el caso en que k>>m. Las igualdades (30), (31) y (32) consti- 
tuyen un sistema completo de condiciones a las que debe someterse 
la matriz incógnita C. Para hacer estas condiciones más claras, procede- 
remos del modo siguiente. Coloquemos las células de Jordan de ja 
matriz B de manera que las células con los valores propios iguales 
estén al lado una de otra. Sea, por ejemplo, 


B=(B+...£Bm)+H(Bmyrr+ >> re 0 
PE +(Bm+1 + es + B.), 


donde en cada uno de los paréntesis figuran células con valores pro- 
pios iguales. Indicando las sumas de estos paréntesis por B'", ... B!+1, 
la matriz B quedará dividida en células mayores que denominare- 
mos bloques. De acuerdo con esto también las matrices X y C que- 
darán divididas en bloques respectivos. Los resullados del punto 
anterior muestran que todos los bloques no diagonales de la ma- 
triz X son iguales a cero; en cuanto a los bloques diagonales de X, 
éstos tienen la estructura descrita en aquel punto. Las condiciones 
obtenidas en el punto presente para la matriz C muestran que sus 
bloques diagonales también se descomponen, igual que en el caso 
de B, en células, con la particularidad de que las células de la 
matriz C tienen una forma triangular especial. Las igualdades (32) 
significan que en las células de la matriz C, pertenecientes a un 
mismo bloque, los elementos que figuran en una misma línea para- 
lela a la diagonal principal son iguales. 
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Sea, por ejemplo, B la matriz (29) considerada a título de 
ejemplo al final del punto anterior. Nuestros resultados muestran 


que la matriz C que conmuta con toda matriz conmutable con B 
será de la forma 


Fay %, Y 2 
y A 
o 
A ai 
C= Ao | ; (33) 
¿AAA 
¡ do A, 
Se | As 


Resta probar que C se puede representar en forma de un poli- 
nomio en B. Haremos esto para el caso particular en que B es de 
la forma (29) y, por consiguiente, C tiene la forma (33); en el caso 
general los razonamientos son los mismos. Es decir, debemos probar 
que la matriz (33) es un polinomio en la matriz (29). Busquemos 
un polinomio f(A) que satisfaga las condiciones 


He)=%. Fr =a, F(p=a, 
f(0)=%, f(0)=14, P(0)=24,. 


Según el p. 16.3 existe un polinomio de esta indole. Aplicando la 
regla (3) del p. 16.1 veremos que f (B)=C. 


Ejemplos y problemas 
I. Hállese An, sí 


l4 2 
A=|0-—3-—2]. 
0 4 3 


2. Hállense todas las soluciones de Ja ecuación X3== A, donde A tlene el 
mismo valor que en el problema anterior. ¿Cuáles de estas soluciones serán poli” 
nomios en A? Calcúlense sennA, eA y cos rr A. 


3. Los divisores elementales de una aplicación 4 son Iguales a AB, (A—1x1)1 y 
AEZ: Calcúlense los divisores elementales de las aplicaciones cos A y sen 4. 


4. SI A y 8 son matrices que conmutan, se tiene ¿AeB=eA+B, 

5. ¿Para qué matrices A tiene solución la ecuación A=eX? 

6. Si F(A) indica la suma de la serie de potencias (19), la suma de la seríe 
de potencias (20), si es que esta serie converge, será igual a f (A). 

7. Hállese la forma general de la matriz que conmuta con una matriz nor- 
mal de Jordan A, sí los divisores elementales A son (A—1P, (11D, A—!, 
(A+ 2) y 4+2. 

8. Supongamos que todos los factores invariantes de la matriz 1£— A, 
salvo el último, son iguales a 1. Entonces toda matriz conmulable con Á es un 
polinomio en A. 


Capítulo V Espacios unitarios 
y euclídeos 


Los espacios lineales que hemos estudiado en los capitulos 
anteriores han resultado ser, en determinado sentido, más pobres 
en conceptos y propiedades que nuestro espacio corriente. En la 
teoría general de los espacios lineales no han quedado reflejados 
conceptos como la longitud de un segmento, la magnitud del ángulo 
y el producto escalar que desempeñan un papel primordial en la 
eometría. Por esto, si queremos que la teoría general abarque 

das las propiedades más esenciales del espacio corriente, debernos 
introducir, además de las operaciones de adición de vectores y de 
multiplicación de los mismos por números, la operación de multi- 
plicación escalar. En este capítulo se estudian precisamente las 
propiedades de los vectores pertenecientes a espacios provistos «tel 
producto escalar. 

En este capítulo el cuerpo principal es de carácter muy espe- 
cial: es el cuerpo de los números reales en el caso de espacios 
euclídeos y es el cuerpo de los números complejos en el caso de 
espacios unitarios. 
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17.1. Axiomática y ejemplos. Sea Y nuestro espacio corriente 
cuyos vectores son los segmentos orientados que parten de un punto 
inicial O, Se llama producto escalar (a, b) de los vectores a y b el 
producto de las longitudes de a y de b por el coseno del ángulo 
que forman estos vectores. De aquí se desprenden directamente las 
conocidas propiedades del producto escalar: 

(a) (a, 0) =(b, a); 

b) (aa, b)=a (a, b); 

(c) (a+b, c)= (a, c) +(b, 0); 

(d) si aso, se tiene (a, a) > 0. 
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Tomemos en el espacio KR un sistema de coordenadas formado 
por tres cualesquiera vectores e,, €, y €,, perpendiculares dos a dos, 
de longitud 1. Entonces todo vector a admite una representación 
única de la forma 


a= ae, + Ey + Uta, 


donde a,, %, y «, son. las longitudes de las proyecciones del vec- 
tor a sobre los ejes coordenados, tomadas con signo adecuado. Si 


b = Pe, +B,e, + Bat, 


es otro vector cualquiera, resulta de la definición del producto 
escalar y de las propiedades (b) y (c) que 


(a, 0) =P, +04P, + ab). (1) 


El espacio Y es real. Esto se expresa en que las proyecciones, 
las longitudes y los productos escalares. de los vectores son números 
reales. Sin embargo, en algunos casos surge la necesidad de consi- 
derar vectores de proyecciones complejas. A primera vista parece 
natural tomar de nuevo la expresión (1) para el producto escalar 
de vectores con coordenadas complejas %,, %,, %a Y B,, Pa, Ps. En 
algunos casos se procede precisamente de este modo. El espacio 
que así resulta se denomina espacio euclideo complejo. Por desgracia, 
el producto escalar pierde entonces muchas propiedades importantes 
y entre ellas la propiedad (d) de importancia primordial. En efecto, 
para el vector 


a=32, + 4e, +5ig, li =Y —1) 

de la fórmula (1) resulta 

(a, a) =9+ 16-+ 254? ==0 
contrariamente a la propiedad (d). Para evitar este inconveniente, 
en lugar de la expresión (1) se toma como definición del producto 
escalar de vectores complejos la expresión 

(a, b)= ab, +5, + Ba, (2) 
donde la raya superior significa que ha de pasarse a los números 


complejos conjugados. En el caso en que los vectores a y b son 


reales, tenemos fP,=B, y la expresión (2) coincide con (1). Por 
consiguiente, la nueva definición (2) es una generalización de la 
anterior. Por otra parte, con la nueva definición la propiedad (d) 
se cumple sin duda alguna, ya que de (2) resulta: 


(a, a) = 0,0%, + %y0y + 09%) =|a, 4/0, +10, 1, 


donde |a,|] es el módulo del número a,. Es fácil ver que las pro- 
piedades (b) y (c) también se verifican. En cuanto a la propledad 
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(a), toma una forma distinta en el caso de vectores complejos. 
Efectivamente, de (2) se tiene 


(b, a) = B,a, + B,a, + By, si B,a, + B,a, SUE PB, ty, 
es decir, 


(a”) (b, a) = (a, b). 


El espacio de vectores complejos en el que el producto escalar 
se calcula mediante la fórmula (2) se denomina unitario. La fór- 
mula (a”) muestra que las propiedades del espacio unitario difieran, 
en general, de las propiedades del espacio corriente. No obstante, 
estas diferencias son de poca importancia. En todo caso, el espacio 
unitario se aproxima más por sus propiedades al espacio corriente 
que el espacio euclíideo complejo mencionado anteriormente. 

Los razonamientos que hemos expuesto no pueden calificarse de 
totalmente precisos. Además, hemos considerado el caso de un 
espacio de tres dimensiones. Por esto debemos dar ahora una defi- 
nición totalmente rigurosa de los espacios unitarios que sea válida 
también para espacios de cualquier dimensión. 

En la teoría general de espacios lineales hemos realizado casi 
toda la exposición aceptando que el cuerpo principal K es total- 
mente arbitrario. En el capítulo presente K será o bien el cuerpo 
de todos los números complejos o bien el cuerpo de todos los nú- 
meros reales. 

Un espacio lineal Y sobre un campo K se llama unitario, si 
a todo par de vectores a y b de * tomados en un orden determi- 
nado corresponde un número de K llamado producto escalar (a, b) 
del vector a por el vector b que posee las propiedades siguientes: 


12 (a, b) =(b, a); 

2” (aa, b)=a(a, b); 

3 (a+0b, c) =(a, e) +(b, c); 

4” sí aso, se tiene (a, a)> 0. 


En el caso en que el campo principal K es el cuerpo de dos 
números reales, el espacio unitario Y se denomina espacio unitario 
real o simplemente espacio euclideo real. En este caso la expresión 
(a, b) coincide, obviamente, con la expresión (a, b) y el axioma 1” 
adquiere una forma más sencilla: (a, b) =(b, a). 

Si el campo K es el cuerpo de los números complejos, el espa- 
cio Y se llama espacio complejo unitario. En lo sucesivo las propie- 
dades de los espacios euclídeos reales y las propiedades de los 
espacios complejos unitarios serán examinadas, en la mayoría de 
los casos, conjuntamente y por espacio unitario se comprenderá, de 
acuerdo con la definición, o bien el espacio unitario real o bien 
el espacio unitario complejo, 
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Notemos también que en la definición de los espacios unitarios 
no se exige que el espacio sea de dimensión finita. Por esto cabe 
hablar también de espacios unitarios de dimensión infinita. Aun 
cuando algunas propiedades de los espacios unitarios no dependen 
de la dimensión de los mismos, nos limitaremos a considerar, 
mientras que no se diga lo contrario, solamente espacios de dimen- 
sión finita. La teoría de espacios de dimensión infinita entra de 
lleno a una disciplina matemática especial que es el Análisis fun- 
cional. 

De las propiedades 1? y 2” resulta 


(aa, Pb) =a (a, Bb) =0. (Bb, a) = af (b, a) =af (a, b), 
es decir 


(aa, Bb) =ab (a, b). (3) 
Análogamente de 1”, 2” y 3” se desprende que 


(a, b4-c) =(b+<c, a) =(b, a) +(c, aj=(a, b)+4 (a, c). 
De aquí obtenemos, mediante el procedimiento corriente, la fór- 
mula general 
(> aa j, > Br) =>»> a Ba, ba). (4) 
Para a=1| y B=0 de la relación (3) resulta 
(a, 0) =(0, a) =0. 
Señalemos dos ejemplos. Consideremos el espacid tineal de filas 
de longitud » con elementos del campo K. Convengamos en llamar 


producto escatar de la fila a=[a,, ..., %,] por la fila b=|[P,, ..., B,) 
la expresión 


(a,b)=0aP,+0B,+.-. +0. (5) 
De esta expresión se ve que 
(a, 0)=4%+... +0,% =|0,P+... +0, [. (6) 


Puesto cue los módulos |a,| son números reales no negativos, la 
suma de sus cuadrados será un número real no negativo que será 
igual a cero sólo en el caso en que sean iguales a cero todos sus 
sumandos. Por consiguiente, la propiedad 4? aquí se cumple. Es 
obvio que las propiedades 1?, 2” y 3” también se cumplen, de modo 
que el espacio de filas con el producto escalar (5) es un espacio 
unitario de dimensión nr sobre el campo K. Este ejemplo es de una 
importancia primordial ya que más adelante quedará demostrado 
que todos los espacios unitarios de dimensión n sobre el campo K 
son isomorfos. 

Como ejemplo de espacio unitario de dimensión infinita puede 
servir el espacio £ de todas las funciones continuas f (?) de valores 
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complejos definidas sobre el segmento (0, 1]. La adición y la mul- 
tiplicación por número de estas funciones se definen de modo cor- 
riente y el producto escalar de una función f(t) por otra función 
g (t) se define mediante la fórmula 


(f, g)= ) 08D at. (7) 


Las propiedades de 1” a 4” se demuestran fácilmente y, por consi- 

guiente, el espacio Y es unitario. En este ejemplo el campo prin- 

cipal es el cuerpo de todos los números complejos. Si nos limita- 

mos a considerar solamente las funciones continuas de valores 

reales, se puede tomar como campo principal el cuerpo de los nú- 

lod reales. La fórmula (7) quedará sustituida entonces por la 
rmula 


E 2= HE de. 
0 ñ 


17.2. Longitud de un vector. El cuadrado escalar (a, a) de 
cualquier vector es, según el axioma 4”, un número rea] no nega- 
tivo. El valor no negativo de la raíz cuadrada de este núniero se 
denomina longitud o norma del vector a y se designa por ||ajf]. Es 
decir, por definición 

fa | = V (a, a). 


De esta definición se ve directamente que el vector nulo es el único 


vector cuya longitud es igual a cero. Además, sí a es un número, 
se tiene 


! aa [| = V (aa, au) => V aa (a, a) A a | V (a, a), (8) 


es decir, al multiplicar un vector por un número su longitud se 
multiplica por el nódulo de este número. Un vector cuya longitud 
es igual a la unidad se llama vector unidad o vector normalizado. 
La igualdad (8) muestra que al multiplicar un vector no nulo por 
el número inverso de su longitud se obtiene un vector unidad. 
Esta operación se llama a veces normalización de un vector. 

Pasamos a la demostración de una desigualdad importante que 
relaciona las longitudes de dos vectores con el valor del producto 
escalar de Jos mismos. 

DESIGUALDAD DE CAUCHY-BUNIAKOVSKi. Para cualesquiera dos 
vectores a y b de un espacio unitario es válida la desigualdad 


[(a, b)| <ll a (1-1161), 


teniendo lugar la igualdad cuando, y sólo cuando, los vectores a y 
b son linealmente dependientes. 
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Para cualquier número A se tiene en virtud del axioma 4* 


(a—, a—M)>0, (9) 
de donde realizando la multiplicación obtenemos 
(a, a)—2(a, b)—A(a, b) +24(b, b) >0. (10) 


Si b=0, la desigualdad requerida se cumple de un modo trivial ya 
que ambos miembros suyos resultan ser iguales a cero. pe 
por ello, que bo. Tomando en la desigualdad (10) en lugar de A 


el número ss o) y multiplicando todos los miembros de la desigual- 


dad por el número positivo (b, b), obtenemos 


la, a) (b, b)—(a, bj (a, b)—(a, b)(a, b)+(a, b) (a, b) >0, 
es decir, 


(a, by(a, b)< (a, a)(b, d) 


(a, 91<l af 1611. (11) 
meEO: herhos demostrado la desigualdad de Cauchy — Buniakovski. 
ia y b son linealmente independientes, se tiene a—1b=3£0 
y en lugar de (9) podemos tomar la desigualdad estricta 
(a—b, a—4b) > 0. 


Pero entonces, podemos omitir en todas las posa li sucesivas el 
signo de igualdad y en lugar de (11) obtendremos la desigualdad 


(a, b)|< 1211-1161). (12) 
En cambio, si a y b son linealmente dependientes, por ejemplo, 
a=ab, tenemos 
(a, d)]=](0b, 6)j=]a|(b, 5)=//a]|-1151). 


Luego, hemos demostrado también la observación complementaria 
a Ja desigualdad de Buniakovski. 

Veamos qué es lo que significa la desigualdad de Buniakovski 
en aquellos espacios concretos que hemos considerado anteriormente. 
Sea ¿ el espacio unitario de filas. Tomemos en el mismo unos vec- 


tores a= [a,, ..., 4] y b=[B,, ..., B,]. Tenemos según la fór- 
mula (6) 


O 


|(a, b)|=|9,B, +0P, +... + GnBal, 
fal =Yla,P+...+[o.P y 1160=V1B,P +... +18,P. 


La desigualdad de Cauchy — Buniakovski significa, por consiguiente, 
que 


AB 08 < VTA PE la PV TB +... +18, 1, 


donde a, y $, son números complejos cualesquiera. 
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Análogamente, si £ es el espacio de funciones mencionado ante- 
riormente, la desigualdad de Buniakovski se convierte en la desi- 
gualdad 
1 


1 1 
VEM)ETO «| <firora fiera 


0 


Volvamos a los espacios unitarios arbitrarios. La desigualdad 
de Cauchy — Buniakovski permite ahora demostrar fácilmente la 
siguiente proposición: la longitud de una suma de vectores no sobrepasa 
la suma de las longitudes de los sumandos. Es obvio que basta con- 
siderar el caso de dos sumandos solamente, ya que el caso general 
se deduce de éste por inducción. Tenemos 


[a+ b1P=(2a+5b, a+b)=(a, a) +(a, db) + 
+(a, D)+(b, b)=(a, a) +2 Re(a, 0) +(b, 6), 
donde Re(a, b) es la parte real de (a, b). Puesto que 
Re (a, b) <] (a, 6)]<l|al1-1101), 


se tiene 
fa 61P <a lP+2/| 411-1161) +/16 [1* = (all +116/1), 
de donde resulta . 
lla+ 51 <llall+-1101 


que es lo que se quería demostrar. 

La expresión [|a—b|| suele llamarse a veces distancia entre los 
vectores a y b. Indicándola por p(a, b) obtenemos las relaciones 
siguientes 


1) p(a, a)=0; p(a, b) >0, si ab; 
2) p(a, b)=p (6, a); 
3) p(a, b)-Ep(b, Cd) > pla, c). 


r La demostración de las mismas es evidente; por ejemplo, Ja 
última resulta de 


p (a, e) =|[a—c]] = || (a —b) + (6 --c) | < 
<lla—611+I10—c||=p(a, b)+p(b, 0) 


17.3. Sisternias ortonormales. Unos vectores a y b de un espacio 
unitario Y se llaman ortogonales si el producto escalar de a por b 
es igual a cero. Si £ es el espacio corriente, el concepto de ortogo- 
nalidad coincide con el concepto de perpendicularidad. Por esto ta 
ortogonalidad puede ser considerada como una generalización del 
concepto de perpendicularidad. 

Del axioma 1? se deduce que la relación de «rtogonalidad es 
simétrica: si el vector a es ortogonal a 6, el vectc- b es ortogonal 
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a a. Es obvio que el vector nulo es ortogonal a cualquier vector del 
espacio y es el único vector que posee esta propiedad. 

Un sistema a,, A, ..., 0, de vectores de un espacio unitario 
se llama ortogonal si cualesquiera dos vectores a, y as (1 +k) del 
mismo son ortogonales. Si el sistema contiene solamente un vector, 
también lo llamaremos ortogonal. 

TEOREMA t. Todo sistema ortogonal de vectores no nulos de un 
espacio unitario Y es linealmente independiente. 

En efecto, sea a,, 4, -.., 4, un sistema ortogonal de vectores 
no núlos y sea 


0Q, + Aglah..- “Any = 0. 
Multiplicando esta igualdad escatarmente por a,, obtenemos 


a (a4,, a)+ 0% (A, ay+... +2 (a, aj) =0 
O 


a,(a,, ay) =0, (13) 


ya que debido a la ortogonalidad del sistema todos los demás tér- 
minos se anulan. Pero a,3£ 0; por consiguiente, (a,, a) 740 y de (13) 
resulta ,==0 que es lo Abe se quería demostrar. 

Sea n la dimensión del espacio £. El teorema 1 muestra que 
todo sistema ortogonal de vectores no nulos de no puede contener 
más de n vectores. Si en L existen n vectores no nulos ortogonales, 
ellos constituyen una base ortogonal del espacio £. Probemos que 
en € siempre existe una base de esta índole. Es más, probemos 
que en todo espacio unitario Y cualquier sistema ortogonal de vecto- 
res no nulos puede ser complementado hasta obtener una base ortogonal 
del espacio Y. Sea dado en £ un sistema ortogonal a,, ..., 4,. Comple- 
mentémoslo hasta obtener un sistema ortogonal maximal a,, ...,Qn, 
Gm+i» ::» A de vectores no nulos. Tal completación es posible, 
ya que según el teorema 1 ningún sistema ortogonal puede contener 
más de n vectores diferentes de cero. Probemos que Q,, ..., Gp, --- 

. ., a, es precisamente la base requerida del espacio *. Conside- 
remos un vector x cualquiera de %. Pongamos 


_(x, dx) 

2 = as ap) (R=1, 2, di oS)a 

y=E10, +E14,+... +6,4,. 
Multiplicando escalarmente todos los términos de la última igualdad 
por 4,, Obtenenios 
(Y, 44) =(%, 04), 

de donde resulta 

(x—yY, 07) =(x, as) —(y, 44) =0, 
Por consiguiente, el vector x-—y es ortogonal a todos los vectores 
Gi, -.., 4, El sistema a, ..., 4, es, por hipótesis, un sistema 
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cENcgonAl maximal de vectores no nulos de €; tluego, x—y=0, es 
ecir, 


x=610, +5,0, +... +55, 


Por lo tanto, el sistema linealmente independiente a,, ..., a, es 
tal que cualquier vector x se expresa linealmente en términos del 
mismo. Pero esto significa precisamente que a,, ..., a, es una base 
del espacio Y. 

Un sistema ortogonal formado por vectores de longitud igual a 
la unidad se denomina ortonormal. Es obvio que normalizando vec- 
tores ortogonales no nulos obtenemos de nuevo vectores ortogonales. 
Por lo tanto, al normalizar los vectores de una base ortogonal del 
espacio, obtendremos una base ortonormal de este espacio. Hemos 
visto que todo sistema de vectores ortogonales no nulos puede ser 
complementado hasta obtener una base ortogonal del espacio. Por 
esto es válido el teorema siguiente. 

TEOREMA 2. Todo sistema ortonormal de vectores de un espacio Y 
puede ser complementado hasta obtener una base ortonormal de este 
espacio. 

Puesto que cualquier sistema que contiene sólo un vector es 
ortogonal, de aquí se deduce, en particular, que en fodo espacio 
unitario existe una base ortonormal. 

Un sistema de vectores €,, €,, ..., €, considerados en un orden 
determinado ha sido llamado sistema de coordenadas de un espacio %, 
si €,, ..., €, forman una base del espacio *. Si e,, ..., €, es una 
base ortonormal, también el sistema de coordenadas se denomina 
ortonormal. La diferencia que existe entre un sistema de coordenadas 
arbitrario y un sistema de coordenadas ortonormal es la misma que 
existe entre un sistema de coordenadas cartesiano oblicuo y un 
sistema ortogonal del espacio corriente. Efectivamente, sea KR el 
espacio corriente de vectores-segmentos provisto del producto escalar 
habitual. Una base arbitraria del espacio dt está formada por tres 
vectores cualesquiera a,, 4, y ay que parten de un punto O y que 
no pertenecen a un mismo plano (véase la fig. 1 de la pág. 79). 


Tomemos un punto Á y expresemos el vector OA en términos de 
los vectores, coordenados a,, a, y a,. Sea 


DA= 0/0, + 00, + Ay A. 


Los números %,, %, y a, son, según la definición, las coordenadas 


del vector OA. Al mismo tiempo, se ve de la figura que estos nú- 
meros son las coordenadas del punto Á calculadas en el sistema de 
coordenadas cartesiano oblicuo con los ejes a,, a, y az, en el que 
los vectores a,, a, y a, se han tomado como segmentos unidades 
a lo largo de los ejes. 
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Por consiguiente, un sistema arbitrario de coordenadas en 3 
es equivalente, desde el punto de vista de la Geometría analítica, 
a un sistema de coordenadas cartesiano oblicuo con distintas uni- 
dades a lo largo de los ejes coordenados. Por el contrario, un sistema 
ortonormal de coordenadas €,, €, y €, será 
equivalente, en este sentido, al sistema de 
coordenadas cartesiano ortogonal habitual 
con unidades ¡guales sobre los ejes 
(fig. 4). 

Los sistemas ortonormales de coordena- 
das de los espacios unitarios tienen varias 
propiedades especificas. Algunas de éstas 
serán consideradas ahora. 

Si €,, € -»., €, es un sistema ortonor- 
mal de coordenadas de un espacio *, las 
coordenadas de un vector cualquiera a son 
iguales respectivamente a los productos escalares (a, e€,), (a, e), 

a (0 la) 
En efecto, sea 


Fig. 4. 


a=0%), +A), +H... “FA nln: 
Multiplicando esta igualdad escalarmente por e, y teniendo en cuenta 
que (€,, e) =0 para ¡«4k, obtenemos 
(A, €) =0%; (Ca, €) = 0%) (k= 1,2, ce.» n) 
que es lo que quería demostrar. 
Si en un sistema de coordenadas ortonormal los vectores a y b tienen 


respectivamente las coordenadas %;, %z, ..., Un Y Bis Bar --» Bn. se 
tiene 


(a, b)=0aP, +abB, +... + AB: (14) 


Efectivamente, sea €,, €, ...¿€n UN sistema de coordenadas orto- 
normal dado y sea 
a=4)e, +0 +... + Onlns 
b= Bj, 3 Pe, + a +B,2,- 
Entonces, 
(a, b)= > af Y Pres) = Y, 2084 (€ ,, €4) = ap, 
DESIGUALDAD DE BESSEL. Si €,,€z, ..., €, es un sistema ortonor- 
mal cualquiera de vectores de un espacio unitario y a es un vector 
arbitrario del mismo y si tomamos « 
(a4,€)=%, (k=1,2,..., m), 
tiene lugar la desigualdad 
(a,d)>2|]aP+ a lt+... +]a.,!?. 


14— 1843 
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Daremos una demostración independiente de esta igualdad, aun- 
que la misma se puede deducir fácilmente de las proposiciones an- 
teriores. Consideremos un vector auxiliar 


=00+0,+... +0 glo: 


Tenernos 
(1—x, a—x) =(a, a)—(a, x)—(x, a) + (x, x)>0, (15) 
(x,)=(Zag, Jae)=>aa,, (16) 
(a, x) =(a, %ae)= Y 0/9), (17) 
(x, a)=(a, x= aa, (18) 


Introduciendo (16), (17) y (18) en la desigualdad (15) obtenemos 
(a, )—Zaa,— Yaya, + Laa,>0, 


(a, a)> Jaja 
que es lo que se quería demostrar. 


Si €,, €4 + --, €, es una base ortonormal, en lugar de la desigual- 
dad de Bessel tendremos, según (14), la igualdad 


(a, 4)=0,0%,+0,%) +... + glo, 
que se llama ¡gualdad de Parseval. La igualdad de Parseval, ade- 
más de ser una condición necesaria, es también una condición sufi- 
ciente para que un sistema e,, €,, ..., €, ortonormal sea una base. 
Si €, €a, --», €n es un sistema ortonormal de vectores de un es- 
pacio Y y si para todo vector a de % se tiene > 


(a, a) = aa, y Ayo, + ... + pas 
donde a,=(a,e), ¡=1,2,..., n, entonces el sistema €,,€z, ..., €, 
es tuna base del espacio 2. 


La demostración se deduce fácilmente de las proposiciones ante- 
riores y queda a cargo del lector. * 


es decir, 


Hemos demostrado la existencia de una base ortonormal en todo espacio 
unitario mediante razonamientos indirectos. No obstante, existe un método 
directo que rente obtener a partir de cualquier base de un espacio una base 
ortonormal del mismo. Este método lleva el nombre de proceso de orfonormalt- 
zación de Gram—Schmidt y se emplea con frecuencia al considerar Jos espacios 
de funciones. Su esencia consiste en lo sigulente. Sea dy, ..., 4 un sistema 
linealmente independiente de vectores de unespacio unitario €. Planteémonos la 
tarea de construir un sistema ortonormal de vectores €£,, €q, -.., € tal que todo 
vector bios ey del mismo se exprese linealmente en términos de los j prime- 
ros vectores ay, ..., 47. Realizaremos lá construcción por inducción. El vector e, 
debe expresarse, según lo convenido, en términos de a, y debe ser de longitud 1. 
Un vector así se obtiene normalizando a;: 


éy = == (1- 


V (a,. a) 
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Supongamos ahora que ya han sido construidos los vectores ey, ..., ey con 


las propledades requeridas correspondientes a un valor de j. Busquemos e,.;. 
Ante todo, escojamos unos números dy, ..., ay de modo que el vector auxiliar 


2 Y +10, +01 +... 0/8, (19) 


sea ortogonal a los vectores €, €z, ..., ey. Multiplicando (19) escalarmente por ez 
(k=1,2, ..., j) veremos que para ello és necesario que 


Uy — (6/41, €). (20) 
Reciprocamente, tomando para Gg los valores de (20) e introduciéndolos en (19), 
obtenemos un vector e,,, ortogonal a €,, €z, -... €. Puesto que a+, no puede 


expresarse linealmente en términos de ay, ..., a; y, por consiguiente, no puede 
ser combinación lineal de tos vectores €, ..., ey, resulta que e; +1 €s diferente 


de cero y, pos lo tanto, puede ser normalizado. Tomemos 


e e, (21) 
+ pa 7 . 

Las relaciones (21) y (19) muestran que e,.,, se expresa linealmente en términos 
de 21, 42, ---. 4/+1. Además, e¡+, está normalizado y es ortogonal a todos los 
vectores €,, ..., €. Por consiguiente, se cumplen les suposiciones de inducción 
y podemos considerar que la sucesión €,, €q. .... € ha sido construida. Si la 
sucesión inicial aj, pa e 4, era una base del espacio, es obvio que la suce- 

obten 


sión €1, €g, +... €m da mediante el proceso de ortonormalización lambién 
será una base del espacio f. 


17.4. Isomorfismo. En el p. 4.3 hemos quedado en llamar iso- 


mortos dos espacios lineales si entre los elementos de los mismos se 
puede establecer una correspondencia biyectiva que conserva las 
operaciones de adición y de multiplicación por número. En los es- 
pacios unitarios a estas operaciones se SEISES además la de mutti- 
plicación escalar. Por esto resulta natural llamar isomorfos los 
espacios unitarios sólo en el caso en el que ellos se comportan 
idénticamente respecto a las tres operaciones mencionadas. 

DEFINICIÓN. Dos espacios unitarios Y y Y, sobre un mismo campo 
de coeficientes se llaman i¿somorfos, si entre sus elementos se puede 
establecer una correspondencia biyectiva en la que la suma de dos 
veciores de Y se transforma en la suma de los vectores correspondien- 
tes de £,, el producto de un número por un vector de X se transforma 
en el producto del mismo número por el vector correspondiente de Y 
y tos ¡proqucios escalares de pares correspondientes de vectores de E. 
y de %, coinciden. 

Tendrán interés para nosotros sólo aquellas propiedades de los 
espacios unitarios que sean propiedades de las tres operaciones prin» 
cipales definidas en estos espacios y que no dependan de la natura- 
leza de los elementos que constituyen los espacios. Desde este pu.1Lo 
de vista los espacios unitarios isomoríos tendrán” las mismas propie- 
dades. De aquí se ve la importancia de saber clasificar, salvo un 
isomorfismo, todos los espacios unitarios. Esta clasificación no difiere 


14 * 
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en nada de la clasificación de los espacios lineales y queda determi.- 
nada por el teorema siguiente. 

TEOREMA 3. Para que dos espacios unitarios sobre un mismo campo 
de coeficientes sean isomorfos es necesario y suficiente que coincidan 
las dimensiones de estos espacios. 

En efecto, si dos espacios unitarios Y y €, son isomorfos, tam- 
bién serán isomoríos como espacios lineales, es decir, respecto alas 
operaciones de adición y de multiplicación por número. Pero los 
espacios lineales isomorfos son de la misma dimensión y, por con- 
siguiente, las dimensiones de los espacios £ y 2, coinciden. Hemos 
demostrado la necesidad. Recíiprocamente, supongamos que las dimen- 
siones de los espacios Y y *, coinciden. Tomemos en Y y £, unas 
bases ortonormales €,, .... ln Y €, ---» €. Diremos que los vecto- 
res xXEL y x"EL, son correspondientes si sus coordenadas en las 
bases escogidas coinciden. Esta correspondencia es biyectiva y con- 
serva las operaciones de adición y de multiplicación por número 
(p. 4.3). Por ello sólo debernos probar que los productos escalares 
de los pares correspondientes de vectores son idénticos. Considere- 
mos dos vectores cualesquiera 


a; + aj)... + Areas 
b=BPje +Pe,+... +Bnen- 

del espacio L. Los vectores correspondientes de £, son 
a =a4, +0 +... +0,€n, 
yYU=Pa PB o+... + Buen. 


Puesto que Jas bases €,, ..., €, y 
mos en virtud de la formula (14) 


(a, b)= ab, + AB, +... +a.Bn = (a”, b”) 
que es lo que se quería demostrar. 


17.5. Sumas ortogonales Proyecciones. Dos conjuntos de vecto- 
res VE y N de un espacio unitario € se llaman ortogonales, si todo 
vector del primer conjunto es ortogonal a todo vector del segundo. 
En particular, se dice que el vector a es ortogonal al conjunto V?, 
si a es ortogonal a todo vector de M. A veces, la ortogonalidad de 
MD? y MN ose indica simbólicamente por M | N. 

Si dos conjuntos M y N son ortogonales, la intersección de los mis- 
mos o bien es vacía, o bien consta del vector nulo únicamente. 

En efecto, si el vector a está contenido en M y en NM, se tiene 
(a, a)=0, de donde a=o. 

Una suma A, +... +A, de varios subespacios lineales se llama 


ortogonal si cualesquiera dos subespacios Y, y YU, (¡74 k) son orto- 
gonales. 


€» «.., €, son ortonormales, tene- 


á 
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Una suma ortogonal de subespacios es siempre una suma directa. 

Efectivamente, si la suma es sólo de dos sumandos, la intersec- 
ción de los mismos, en virtud de la observación anterior, consta 
solamente del vector nulo y, por consiguiente, la suma es directa. 
En el caso general, la demostración se realiza por inducción. 

Si ta suma 


AA, +A, +... +9, 
es ortogonal y si 
a=4,+4,+...+0,, 
b=b,+0,+...+0., 
donde a,E€A, y b,€A,, ¡=1, ..., s, se tiene 
(a, b)=(0,, 0,)+(0,, 0Y+-.. +(8,, 04). (22) 


En efecto, puesto que A, | A, para ¡=k, resulta que (a, b,)=0. 
Por consiguiente, 


(a, b)=(Ya, Y0)= 22 (a,. b)= Y (a, b) 
que es lo que se queria demostrar. 

Consideremos ahora un conjunto no vacio cualquiera Wi de vec- 
tores de. un espacio unitario *. El conjunto de todos los vectores 
del espacio *£ ortogonales a Wi se Mama complemento ortogonal 
del conjunto D? y se indica por Di. 

El complemento ortogonal de un conjunto no vacío cualquiera Mi 
es un subespacio lineal. 

En efecto, si a y b pertenecen al complemento ortogonal Mi y 
c es un vector cualquiera de Vi, se tiene 

(aua-+ Pb, c)=xa (a, c)+B(b, c) =0. 
Por consiguiente, cualesquiera que sean a y f el vector aa + Bb 
está contenido en DL y MA es un subespacio lineal. 

TEOREMA 4. Todo espacio unitario Y es la suma directa de cual- 
quier subespacio lineal suyo YU y de su complemento ortogonal Y, 

Sea €,, €, -.., € una base ortonormal del subespacio Y y sea 
€m+1 ---» € Una base ortonormal del subespacio A-L. Para demos- 
trar el teorema es suficiente ver que €,, ..., €m, -.--, €, es una 
base del espacio *. Supongamos, por el contrario, que el sistema 
€) -.., €, ño es una base del espacio €. Entonces, de acuerdo con 
el teorema 2, este sistema puede ser complementado hasta obtener 
una base ortonormal del espacio *. Sea e uno de los vectores 
complementarios. Puesto que e es ortogonal a todos los vectores 
wm +...» Cy el vector e está contenido en At. Por consiguiente, 
AL contiene un sistema ortonormal y, por ende, linealmente inde- 
pendiente de vectores €... ,, »--, €; €. Pero esto contradice a nuestra 


hipótesis de que €mw .--» €y es una base de 91. Hemos demos- 
trado el teorema. 
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Del teorema 4 se desprende, en particular, que 
NL LA. (23) 


Efectivamente, 914 está contenido indudablemente en Y. Por otra 
parte, según el teorema 4, para cualquier x de UL tenemos 


x=a+b, daEd y beYAn. 


Multiplicando escalarmente esta igualdad por 6, obtenemos (b, b) == 0, 
es decir, b=0 y x=a. Luego, Ul1=Y, 

» Definemos, para concluir, el concepto de proyección ortogonal 
de un vector sobre un subespacio lineal. Sea Y un subespacio 
lineal de un espacio unitario Y. En virtud del teorema 4, £ es la 
suma directa del subespacio A y de su complemento ortogonal AL. 
Por consiguiente, todo vector x de £ puede ser representado 
univocamente en forma de una suma 


x=a+b (ac A y bEAL). (24) 


El sumando a se llama proyección del vector x sobre el subespacio Y. 
Puesto que de acuerdo con la fórmula (23) A es el complemento 
ortogonal de A., el sumando b de la igualdad (24) representa la 
proyección del vector x sobre el subespacio YU. 

Multiplicando (24) por un número «a, obtenemos 


ax =oaa + ab laa EA y abel), 


es decir, la proyección del producto de un número por un vector es 
igual al producto de este número por la proyección del vector. 
Análogamente se demuestra también la proposición de que 
la proyección de una suma de vectores sobre un subespacio es tgual 
a la suma de las proyecciones de los sumandos sobre este subespacio. 


Ejemplos y problemas. 


Il. Sea €e,, € y € un sistema ortonormal de coordenadas de un espacio 
unitario de tres dimensiones. Pruébese que el sistema de vectores 


l 
a1 =3 (2e, + 2e,— a), 
=$ (20, e7+2e0) 
/ 
a4==3 (er — 2e, + 2e3) 


también constituye un sistema ortonormal de coordenadas de este espacio. 

2. En un espacio unitario € se ha tomado un sistema ortonormal de coor- 
denadas €, ..., €n. Pruébese que un sistema de vectores a4,, ..., 4, será también 
una base ortonormal del espacio L cuando, y sólo cuando, la matelz formada 
por las filas coordenadas de estos vectores sea unitaria (véase el p. 1.3) 
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3. Si 1, -.., %p es una base ortonormal de un subespacio líneal %, la 
proyección de un vector x sobre Y es igual a 


(x, 41) 0,+(%, 43) 094... + (X, 0) 09. 


4. En el espacio de todos los polinomios en A de grado no mayor que n el 
producto escalar se define mediante la fórmula (7) del p. 17.1. Pruébese que éste 
será un espacio unitario de dimensión n+-1. Pruébese que ortonormalizando 
según Gram-—Sckmidt en este espacio la sucesión 1, A y A* obtenemos los 
polinomios 1, Y3 (241) y VÍ (64261 + |). 

5. Se llama determinante de Gram de un sistema de vectores az, Ag, ..., Gn 
de un espacio unitario £ de n dimensiones el determinante 


(61, 41) (27, %) ... (ar, an) | 
A ma (as, a) (2,, la) +... (az, Qn 


(2, a,) (8, 4) ... (An. An) 


Supongamos que en ( se ha escogido un sistema ortonormal de coordenadas. 
Pruébese que el determinante de Gram Á es igual al cuadrado del módulo del 
determinanle formado por las filas coordenadas de los vectores ay, ..., Gp. 
Pruébese también que a,, 4%, -... 4, son linealmente independientes cuando, 
y sólo cuando, el determinante de Gram de los mismos sea diferente de cero. 

6. Dése una interpretación geométrica al proceso de orlonormalización de 
Gram-—Schmidt en el caso del espacio habltual de tres dimensiones de los 
vectores-segmentos. 
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18. 1. Funciones lineales. Sea £ un espacio lineal cualquiera 
de dimensión finita sobre un campo K. Pongamos en correspondencia 
a todo vector x de Y un número f(x) de K. Las correspondencias 
de este tipo han sido llamadas en el p. 4.1 funciones con valores 
en K definidas sobre Y. Una función f(x) se llama lineal si para 
cualesquiera x e y de Y y cualesquiera a y PB de K se tiene 


f(ax + By) = af (x) + BH y). (1) 
Tomando en (1) «=P =0, obtenemos 
f (0) =0. 


Por esta razón en lugar de «función lineal» se dice a veces «función 
lineal homogénea». 

Es fácil ver que la suma de funciones lineales y el producto de 
un número por una función lineal son de nuevo funciones lineales. 
Probemos, por ejemplo, la primera proposición. Sea f=g-+h, 
donde g y A son funciones lineales. De acuerdo con la definición 


[(ax + By) =8 (ax + By) 4h (ax+ By) = 
=08 (x) + Pg (y) + añ (x) + Bh (y) =af (x) + Bf (y) 


que es lo que se quería demostrar, 
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Conocemos ya que las operaciones de adición de funciones y de 
multiplicación de las mismas por números satisfacen los axiomas 
de un espacio lineal. Puesto que la suma de funciones lineales y 
el producto de una función lineal por un número son de nuevo 
funciones lineales, resulta que el conjunto de todas las funciones 
lineales, definidas sobre un espacio vectorial *, es por sí mismo 
un espacio líneal. Este espacio se llama espacio conjugado (o dual) 
respecto a Y y se Indica por Y”. 

De la igualdad (1) que caracteriza las funciones lineales se 
desprende inmediatamente una relación más general 


f(x, + apta. FOX) 20 (A) A ADA + at (Xm), (2) 


cuya demostración omitimos ya que es obvia. Los teoremas que 
siguen esclarecen en gran medida la estructura de las funciones 
líneales. 


TEOREMA 1. Sea €, lp ..., €, un sistema de coordenadas cual- 
quiera de un espacio lineal Y. Tomemos una sucesión totalmente 
arbitraria Q,, Ay, ..-, A, de números de K. Entonces existe una 


función lineal f(x), y sólo una, que está definida sobre Y y que 
satisface las condiciones 


Fep=a, (J=1, 2, ..., A). (3) 
DEMOSTRACIÓN. Sea x un vector de *: 
x=E1€, + Ext, + --- + Eno (4) 


Poniendo en correspondencia a este vector el número a,É, + 
+ajt +... +4,É,, obtenemos una función f(x) sobre Y. Es decir, 
por definición 


(0) =9,5 + a+... Fan 


Tomando aquí x=e, tendremos f(ej)=a,) (¡=1, ..., n). Por otra 
parte, si 
y = NE + Mia HA Mié» (5) 


tenemos 
| [(y) > 0/9, +2 +... +02n: 
De (4) y de (5) se deduce que 
ax+By=(a, +Bn)e +... +(0E,+Bn,)€,, 
de donde s 
flax+PBy)=a, (a, +Bn)+.-. +0, (a, + Bn.) =0f (x)+8Bf (9). 


Por consiguiente, f(x) es una función lineal. 

Hemos demostrado que existe una función lineal que satisface 
las condiciones (3). Probemos que es única. Sea g(x) una función 
linea] tal que g(e)=a, (J=1, .--, n). Entonces para un vector 
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cualquiera x de coordenadas E,, .... E, tendremos 


E (x)=8 (810, +... +Enta) =58 le) +... +5,8 (61) = 
=Ea +... + Es, Ls 
es decir, g (x) =f (x). 

El teorema 1 ha sido demostrado para espacios lineales L cua- 
lesquiera. Si el espacio Y es unitario, las funciones lineales sobre Y 
tienen una expresión muy sencilla en términos del producto escalar. 

TEOREMA 2. El producto escalar (x, a) de vectores de un espacio 
unitario £ es una función lineal de x siendo a fijo. Con ello a todo 
vector a de Y se pone en correspondencia una función lineal definida 
sobre %. Además, para distintos vectores se obtienen distintas 
funciones lineales y todas las funciones lineales sobre Y pueden ser 
construidas por este procedimiento. 

La primera afirmación es evidente, ya que de f(x)=(x, a) se 
deduce que 


f (ax +By) = (ax +By, a)=u (x, a) + B (y, a) =af (x) + Bf (y). 


Demostremos la segunda afirmación. Supongamos que, al contrario, 
a diferentes vectores a y b corresponde una misma función lineal; 
entonces esto significa que la a (x, a)=(x, b) tiene lugar 
para cualesquiera vectores x de Y. Pasando los términos a un mismo 
miembro, podemos representarla en la forma (x,a—b)=0, de donde 
tomando x=a—b obtenemos (a—b, a—b):=0. Pero el vector nulo 
es el único vector cuyo cuadrado escalar es igual a cero, es decir 
a—b=0 0 a=b. Resta demostrar la tercera afirmación, esto es, 
que toda función lineal f(x) definida sobre Y puede ser representada 
en la forma 


f(x) = (x, a), (6) 


donde a depende de f y x es un vector arbitrario de *, Indiquernos 
por Y el conjunto de todos los vectores para los cuales f(x) =0, 
Puesto que Ho) =0, el vector o indudablemente pertenece a A, 


Además, si los vectores a y b pertenecen a %l, se tiene 
f (aa + Bb) =af (a) + Pf (0) =0, 


es decir, también aa--fPb pertenece a A. Por consiguiente, Y es un 
subespacio lineal del espacio €. Si A=2, resulta que f (x) =0 para 
todos los vectores x. Para satisfacer la condición A es suficiente 
tomar en este caso a=0. Supongamos por ello que A 4, Tomemos 
un vector no nulo bh cualquiera de £ que sea ortogonal a 21 y tra- 
temos de determinar un número «a tal que el vector a =ab satisfaga 
la relación (6). Sea f(b)=fP y sea f(x)=8E, donde x es un vector 
cualquiera de Y, Tenemos 


Hx—$b)=1()—$1(0)=0. 
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Indicando por e la diferencia x—p0, veremos que c pertenece a Y 


y que x=c+ $b, De aquí resulta 
(x, a=(Eo+o, ab) =%E (p, b)+a(c, b). 


Puesto que el vector b es ortogonal a A, tenemos (c, b)=0 y, por 
consiguiente, 


(x, =$ 0, b). (7) 
La igualdad (7) muestra que siendo a=B(b, b)”* se tiene para 


cualquier x 
(x, a) =E=f (x) 
que es lo que se quería demostrar. 


18.2. Aplicaciones conjugadas. Emplearemos ahora los resultados 
det punto anterior con el fin de obtener para toda aplicación lineal 
de un espacio unitario una aplicación mueva univocamente deter- 
minada y llamada conjugada de la dada. 

Sea 4 una aplicación lineal de un espacio unitario €. Tomemos 
en 2 un vector arbitrario y y consideremos la expresión 


Hx) = (xa, y). (8) 
donde x es un vector variable. Puesto que 
au + Bu) + ((au 4 Bu) A, y)= (0-44 + B-04, y) =af (1) +BF (0), 


f(x) es una función lineal. Por esto f(x) puede ser representada, 
de acuerdo con el teorema 2, en la forma 


H(x) = (x, a), (9) 


donde el vector a queda determinado univocamente por la función 
f(x), es decir, por la aplicación 4 y por el vector y. Si considera- 
mos XA como una aplicación dada y hacemos variar el vector y, 
tendremos entonces para todo vector y un vector determinado a. La 
aplicación que transforma y en a se indica por 4* y se llama cor» 
jugada de A; es decir, a=yA". Introduciendo este resultado en (9) 
y comparando con (8) obtenemos la relación 


(xd, y) =(%, yA”) (10) 


que tiene lugar para cualesquiera vectores x e y de Y. 

La propa (10) caracteriza plenamente la aplicación conju- 
gada 4*. En efecto, sea W4 una aplicación con la misma propiedad, 
es decir, que para cualesquiera x e y 


(xa, y) = (1, yB) 
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(x, yA) —Ax, yB) =(x, yA*— y BD) =0. 
Esto significa que el vector y4*-—yB es ortogonal a todo el espa- 


cio, de donde resulta que 
yA” =y3. 


La última igualdad tiene lugar para todos los y y, por consiguiente, 
tit=3X3G. 

Es fácil demostrar ahora que fa aplicación conjugada A" es li- 
neal. Efectivamente, en virtud de (10) se tiene 


(x, (au + Bu) 4%) =(x4, au+ Pu) =02 (xd, 1) +B(x4A, 0) = 
= 0 (x, UA) +B (x, vA*) =(x, 0-44" + Bud?) 


cualquiera que sea el vector x. Debido a la segunda afirmación del 
teorema 2 esto implica la igualdad 


a (adn + Bu) 4? =0a-ud*+B-uA* 

que significa precisamente que .4* es lineal. 

La operación de paso a la aplicación conjugada posee las pro- 
piedades siguientes: . 

a)  — (AYy=A, 

D) (adj =a.4", 

C) (d +4 BY 4438, 

d) (UB) = BA". 

Todas estas propiedades se demuestran de un mismo modo y por 


ello nos limitaremos a demostrar sólo una de ellas. 
Por ejemplo, 


(143, y) = (xAÁ, y”) = (x, yBAS, 
es decir, (A—ABI' == BA*. 
Notemos aquí mismo que las aplicaciones conjugadas de las apli- 


caciones identidad y nula coinciden con ellas misimas. Efectiva- 
mente, 


x6, y) =(x, y) =(x, y 6) Y (x6, y) =0= (x, y6). 

Veamos la relación que existe entre las matrices de las aptica- 
ciones conjugadas. Tomemos en el espacio Y un sistema ortonormul 
de coordenadas €,, €, .--» €, y sea 

ejA =0 2, Fa e +... + Oigln, 
E gut *= Be, a A +... + Ben ( => l, ... .p n). 
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Multiplicando estas igualdades escalarmente por e, y teniendo en 
cuenta que el sistema e,, ..., e, es ortogonal, obtenemos 


(e A,e)=0;, y let” ep=PB,, (iy ¡=1, ..., a). 
De aquí resulta que 


/=(e/A, ej) =(8,, e, 4*) =(e,4*, e) =Byp 
Por consiguiente, si Á es la matriz de la aplicación 4, la matriz 
de la aplicación conjugada 4* será igual a Á'. Hemos obtenido el 
siguiente teorema. 

TEOREMA 3. Si una aplicación lineal A tiene en un sistema orto- 
normal de coordenadas la matriz A, la aplicación conjugada A* tendrá 
en este mismo sistema la matriz conjugada transpuesta A". 

La operación del paso a las aplicaciones conjugadas posee las 
propiedades a), b), c) y d). En base al teorema 3 deducimos de 
aquí que estas mismas propiedades posee también la operación del 
paso a las matrices conjugadas transpuestas. Este resultado se ob- 
tiene también mediante cálculo directo (compárese con el p. 1.3). 


18.3, Aplicaciones normales. Una serie de propiedades notables 
pueden ser obtenidas en el caso de las aplicaciones lineales de un 
espacio unitario que conmutan con sus” conjugadas, es decir, que 
satisfacen la relación 

AR AA. 


Estas aplicaciones se llaman normales. Recordando que en un sisterna 
ortonormal de coordenadas las aplicaciones conjugadas tienen ma- 
trices conjugadas transpuestas, llegamos directamente a la conclusión 
de que son normales aquellas aplicaciones lineales de un espacio 
unitario, y sólo aquéllas, cuyas matrices, calculadas en unas bases 
ortonormales, satisfacen la relación 


AÁ'=4'A. 

Con la misma facilidad se obtienen también las siguientes pro- 
piedades de las aplicaciones normales. 

TEOREMA 4. Todo vector propio a de una aplicación normal A 
correspondiente a un valor propio p es al mismo tiempo un vector 
propio de la aplicación conjugada A” pero correspondiente al valor 
propio conjugado de p. 

Tenemos 

AAA y alda—p$)=0. 
De aquí resulta 
o=(a(4—p6),0 (4A—p6)) = (8 (4 —p6) (4* —p6”, a) = 
= (a (4A*—p6 Na —p6), a)=(4 (4*—pó6), a(14*—p6), 
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es decir 
a(A*—pé$)=0 
que es lo que se quería demostrar. 
TBOREMA 5. Los vectores propios correspondientes a diferentes va- 


lores propios de una aplicación normal A son ortogonales. 
Sea 


aA=pa y bA=0b (p 0). 
Entonces 
p(a, b)=(aít, b)=(a, bA*)=0 (a, b), 
es decir, 
(p—0)(4,b)=0 y (a,b)=0,. 

Algo más compleja es la demostración del siguiente teorema 
principal. 

TEOREMA 6. Para toda aplicación normal 4 de un espacio unita- 


río complejo existe una base ortonormal formada por los vectores pro- 


pios de la aplicación A; la matriz de A es de forma diagonal en 
esta base. 


Para la demostración tomamos en el espacio inicial L£ un vector 


propio cualquiera a,>+o de la aplicación 4 e indicamos por £, el 
subespacio ortogonal a a,. Si 


aq, A =P, y xE%,, 
se tiene 


(2,, XA) =(0,t*, x)= p, (a,, x) =0, 


es decir, el subespacio £, es invariante respecto de 4. De la inva- 
riancia de %, se deduce que en él existe un vector propio a, de la 
aplicación 4. Indiquemos por *, el subespacio formado por todos 
los vectores de * ortogonales a a, y pongamos %;,=*2,NM2,. Puesto 
que 2, y Y, son invariantes respecto de .4, también será invariante 
el espacio de en el cual debe existir, por consiguiente, un vector 
propio no nulo a, de la aplicación 4. Indicando por 2, el conjunto 
de todos los vectores de £ ortogonales a a, y tomando %; =*,N,N2,, 
obtenemos un subespacio invariante de vectores ortogonales a a,, a, 
y as. Continuando el proceso encontraremos la base ortogonal re- 
querida G,, Gj, ..., 4, del espacio £ formada por los vectores 
propios de la aplicación 4. 

La propiedad de las aplicaciones normales de los espacios com- 
plejos establecida en el teorema 6 es característica para estas apli- 
caciones. Efectivamente, si la matriz A de una aplicación 4 es 


diagonal en una base ortonormal, la matriz A” de la aplicación 


conjugada también será diagonal y, por consiguiente, conmutará 
con A. 
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En los espacios unitarios reales la situación es algo diferente. 
Para analizarla demostremos primero una proposición general rela- 
cionada con unas aplicaciones reales lineales cualesquiera. 

TEOREMA 7. Toda aplicación lineal A de un espacto real no nulo 
tiene por lo menos un subespacio invariante de dimensión 1 o 2. 

Si el polinomio característico p(A) de la aplicación 4 tiene una 
raíz real a, la aplicación 4 tiene en Y un vector propio no nulo. 
El subespacio tendido sobre este vector será el subespacio invariante 
requerido de una dimensión. 

Supongamos ahora que q (A) no tiene raíces reales. En este caso q (A) 
tendrá un par de raíces conjugadas «ua=p-+ io y a=p—igd, 
ya que los coeficientes del polinomio q (A) son reales. Tomemos en 2 
un sistema de coordenadas €,, €,, ..., €, y sea A la matriz de la 
aplicación 4 en este sistema. Consideremos la ecuación 


(8,, Es» Pen E.) A=a lí, E, A A (11) 


donde £,, E,, ...-, 5, son unas incóg. 'itas cuyos valores deterrrina- 
remos en el cuerpo de los números complejos. La ecuación (11) puede 
ser representada en la forma 


[E,, 81, ---+E,] (a.E— 4)=0, 


donde E es la matriz unidad y O es la fila nula. Esta ecuación 
equivale a un sistema de ecuaciones lineales homogéneas respecto a 
las incógnitas E,, ...,E, de matriz (aE— Ay (compárese con el 
p. 11.4). Puesto que el determinante de esta matriz es p(a) y, por 
consiguiente, es igua)] a cero, la ecuación (11) tiene en el cuerpo 
de los números complejos una solución no nula que indicaremos por 
las mismas letras E,, ..., E,. Tomemos para abreviar 


[€,, Ens ...-, En) =X, 
de modo que la relación (11) se convierte en 


XA =ux. (12) 


Pasando aquí a los números complejos conjugados, obtenemos x Á=u x. 
Pero los elementos de la matriz A son reales y, por lo tanto, ÁA==A y 


xÁ=ax. (13) 
Puesto que las filas x+X e 1(x—x) son reales, en el espacio £ existen 


unos vectores a y b, cuyas filas coordenadas serán iguales respecti- 
vamente a id 


ES (14) 
[6] = 5 (*—x). 


| 
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Expresando aquí x y x en términos de [a] y [b] y empleando (12) 
y (13), llegamos a las relaciones 


al A=p [a] —o [0], 
Macelzskh coi 
Estas relaciones equivalen a las igualdades 


ad =pa— ob, 
DÁ = 04 + po ) 


que muestran que el subespacio tendido sobre los vectores a y bes 
invariante respecto a la aplicación 4. Hemos demostrado el teorema. 

Supongamos ahora que el espacio considerado Y es un espacio 
unitario real y que 4 es una aplicación normal del mismo, cuyo 
polinomio, característico q (4) tiene dos raíces conjugadas p+ ¿o y 
p—io(0>0). Tomando para el sistema de coordenadas e,, ..., €, 
de * una base ortonormal cualquiera y repitiendo el razonamiento 
anterior, obtendremos de nuevo en * unos vectores a y b 
ligados por las relaciones (15). Probemos que los vectores a y b 
serán ahora ortogonales. En efecto, para determinar estos vectores 
hemos tenido que considerar el espacio de filas Í sobre el cuerpo de 
los números complejos. Podemos aceptar que este espacio de filas 
es unitario, tomando, de acuerdo con el p. 17.1, para el producto 
escalar de las filas [g,, ..., E,] y [M., -. -» 1,] la expresión EnF... 
... +E,8,. Las filas [e,], ..., [e,] forman una base ortonormal 
de *. La aplicación consistente en la multiplicación de las filas por 
una matriz A será una aplicación lineal y su matriz coincidirá con Á 
en la base señalada. Puesto que A=A, la aplicación considerada 
será normal y las filas x y x, determinadas durante la demostración 
del teorema 7, serán unos vectores propios correspondientes a dife- 
rentes valores propios p+-i0 y p—io. En virtud del teorema 5 
tenemos (x, x) = 0, de donde 


(15) 


((a], (0) =3(+%, x—x)=0, 


es decir, (a, 5) =0. Tomando para x un vector de longitud V2, ob- 
tendremos de (14) que a y 5 serán de longitud 1. 

Demostremos además que el subespacio de Y ortogonal a a y b 
será invariante respecto de 4. En el espacio de filas Y el subespa- 
cio ortogonal a [a] y (6) coincide con el subespacio Y, ortogonal a 
x y x. Este último subespacio es invariante respecto de Y, ya que 
es la intersección de subespacios ortogonales a los vectores propios 
x y x de una aplicación normal. Sea ahora yE2 y (a, y)=(6, y)=0; 
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entonces [y) €, e [y] A€%,, de donde resulta 
(yA, a)=([y] A, [a))=0 y (y4,b)=0 


que es lo que se quería demostrar. 
La aplicación 4, inducida por la pon Á en el espacio de 
dos dimensiones tendido sobre los vectores a y b tiene, en virtud 


de (15), la matriz 
—0 
A, = E Al 


Tomando para el número complejo p +40 la expresión r (cos p—i sen p), 
podemos representar la matriz A, en la forma 


cos sen 
Aer | 50 li 


Por consiguiente, 4, es el producto de la aplicación de matriz rE 
y de la aplicación de matriz a o sol La primera es una 
aplicación de semejanza de centro en el origen de coordenadas y de 
coeficiente de dilatación igual a r y la segunda representa, como 
puede verse fácilmente, un giro de ángulo y de los vectores alrededor 
del origen de coordenadas en el plano determinado por a y b. 

TEOREMA 8. Para toda aplicación normal A de un espacio real 
unitario Y existe en Y una base ortonormal en la que la matriz de 
la aplicación A tiene la forma 


a, a! 


A=| . | +4r[ “oso snq]+4... 
| —senq, Coso, 


Le 


COS Y. Sen p 


donde los números k y m pueden ser iguales a cero. 

La demostración es casi idéntica a la demsotración del teorema 
análogo 6. La diferencia estriba solo en que mo podemos afirmar 
ahora que todo subespacio Y; invariante respecto de 4 contiene un 
vector propio no nulo a,,, de la aplicación 4.' Pero si Y, no con- 
tiene vectores propios de la aplicación 4, en Y, existe, en virtud 
del teorema 7, un par de vectores reciprocamente ortogonales a,, ; 
y 6í,, ligados por relaciones de tipo (15). Para el subespacio Y;,, 
se puede tomar entonces el conjunto de vectores de % ortogonales 
a Gi,, Y Bj», De las observaciones hechas anteriormente resulta 
que *,,, será invariante respecto de 4 y el proceso se puede con- 
tinuar después ún el esquema expuesto en la demostración del 
teorema 6. Así obtendremos una base ortonormal de Y compuesta 
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por los vectores Q,, ..., Gp Grrro Prvp +» «>» Crom Urrom ligados 
por relaciones de tipo 


ap) A=a, 4) (p=l, ..., k), 
AgÁ = P¿A, — 04h =1, ... : 
a ela] (q l, , M, 38, 0); 
estas últimas muestran que la matriz de la aplicación A tendrá 
en la base señalada precisamente la forma (16). 


Ejemplos y problemas 


t. Tomemos en el espacio euclídeo corriente de tres dimensiones R una 
recta orientada que pasa por el orlgen de coordenadas e indiquemos por f (x) 
la longitud de Ja proyección del vector x sobre esta recta tomada con el signo 
correspondiente. Pruébese que f(x) es una función lineal y que toda función 
lineal sobre el espacio H es de la forma af (x), donde «0 y el eje de proyec- 
ción se ha escogido convententemente (compárese con el teorema 2). 

2. Una función f(x) definida sobre un espacio lineal complejo se llama 
antilineal, si f er =[(04Í Y) y [(ax)=af (x). Pruébese que toda función 
antilineal sobre un espacio unitario es de la forma La x). 

3. Demuéstrese que la correspondencia establecida en el problema anterior 
entre Jos vectores de un espacio unitario L y las funciones antilineales es un 
isomorfismo entre Y y el espacio de todas las funciones antilineales sobre *. 

4. En un espacio unitarlo Y con una base no ortonormal a,, a, y a, están 
dadas dos aplicaciones lineales 4 y 3 de matrices 


10 0 1 2-2 
A=|-—12 o yB=| 2-1 o]. 
02 —1 2 1.0 


Hállese una base ortonormal de l, si se sabe que 4 y 3 son normales 
y que el vector a, es de longitud 1. 

5. Pruébese que sobre un espacio unitario complejo se puede extraer la 
raiz de cualquier grado natural m de toda aplicación normal, es decir, que para 
toda aplicación normal 4 existe una aplicación 3, también normal, tal que 
Ba=. A. ¿Cuál es el número máximo de estas aplicaciones B? 

6. Demuéstrese que siendo Y un subespacio invariante de una aplicación 


normal 4, el complemento ortogonal U2 también será invariante respecto de 4. 
Si el espacio principal es complejo, la propiedad indicada caracteriza las apll- 
caciones normales. 
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19.1. Aplicaciones unitarias. Una aplicación isomorfa de un 


espacio unitario sobre sí mismo se llama aplicación unitaria de 
este espacio. Con más detalle: una aplicación lineal regular U de 
un espacio unitario £ se llama unitaria, si no altera el valor del 
producto escalar, es decir, si para todos los a y b de * tiene lugar 


la relación 
(a, b) =(aU, bU). (1) 
15—1843 
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Las rotaciones del espacio euclideo corriente de tres dimensio- 
nes alrededor del origen de coordenadas O representan el ejemplo 
más sencillo de aplicaciones unitarias. Las reflexiones especulares 
de este espacio respecto a un plano cualquiera que pasa por O re- 
presentan otro ejemplo de aplicaciones unitarias del espacio corriente. 
Se puede probar fácilmente que con las combinaciones de estos dos 
tipos de aplicaciones se agotan todas las aplicaciones unitarias del 
espacio corriente. Por esto las aplicaciones unitarias de espacios 
se pueden considerar como las aplicaciones análogas a las rotaciones 
y a las reflexiones especulares del espacio euclídeo corriente. 

De la igualdad (1), que caracteriza las aplicaciones unitarias, 
se deduce que 


(, y =(U, yU)=(x, yUu*), 
de donde resulta que 
UU'=8, UY = UA y UU. (2) 


Recíprocamente, de las relaciones (2) se deduce que U es inver- 
tible y que 
(x, y) =(x, yUU”) =(U, yU). 


Por consiguiente, una aplicación lineal U es unitaria cuando, 
y solo cuando, la aplicación conjugada U* coincide con la inversa U”!, 
En particular, las relaciones (2) muestran que las aplicaciones 
unitarias son aplicaciones normales en el sentido del punto anterior. 
Tomemos en un espacio £ un sistema ortonormal de coordenadas 
y sea UY una aplicación unitaria de este espacio. Si la matriz de 
la aplicación U es igual a U, la matriz de la aplicación conjugada 


es igual a U" de acuerdo con el p. 18.2. De la relación (2) se 
desprende por lo tanto que 
UT'"=E. (3) 


Recíprocamente, si la'matriz U de una aplicación lineal Y satisface 
en un sistema ortonorma) de coordenadas la relación (3), la propia 
aplicación U satisface las relaciones (2) y es, por consiguiente, 
unitaria. Las niatrices U que satisfacen la relación (3) se llaman 
unitarias (p. 1.3); llegamos, por lo tanto, al resultado siguiente: 
toda aplicación unitaria tiene en un sistema ortonormal de coordena- 
das una matriz unitaria; reciprocamente, si la matriz de una apli- 
cación lineal es unitaria en un sistema ortonormal de coordenadas, 
la propia aplicación es unitaria. 

Siendo real el campo principal K las matrices de las aplicaciones 
también son reales y la relación (3) se convierte en 


UU” ss E. (4) 
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Las matrices que satisfacen esta relación han sido llamados en 
el p. 1.3. ortogonales. Es decir, toda aplicación real unitaria tiene 
en una base ortonormal la matriz ortogonal. Recíiprocamente, si en 
una base ortonormal la matriz de una aplicación lineal de un es- 
pacio real unitario es ortogonal, la aplicación es unitaria. 

Las aplicaciones unitarias no alteran, por definición, los valores 
de los productos escalares. De aquí resulta que las aplicaciones 
unitarias no alteran las longitudes de los vectores. 

La última propiedad es característica para las aplicaciones 
unitarias: si una aplicación lineal UU de un espacio unitario Y no 
altera las longitudes de los vectores, la aplicación U es unitaria. 

En efecto, sean a y b unos vectores arbitrarios de L. Tomemos 


au =0' y DU =0b'. 
Puesto que la aplicación U es lineal, tenemos 
(a + ab) U =4' + ab' 
para cualquier valor a del campo de coeficientes. Por hipótesis, la 
aplicación U no altera las longitudes y por lo tanto 
(a+ ab, a+ ab) =(a + ab”, a' + ab"). 


Realizando aquí la multiplicación y reduciendo los términos seme- 
jantes, obtenemos 


a(b, a)+ala, b)=a(b", a) +a(a”, b”). (5) 
Para a=1 esta igualdad se convierte en 
(b, a)+(a, b)=(b", a) 4+(a”, 6”). (6) 


Si el campo principal es real, tenemos (b, a) ==(a, b) y de (6) re- 
sulta (a, b)=(a', b'). En cambio, si K no es real, tomando en (5) 
a=i y simplificando en ¿, llegamos a la relación 


(b, a)—(a, b)=(b", a) —(a”, b”) 
que con (6) da de nuevo (a, b)=(a', b'). Luego, tenemos en ambos 


Casos 
(a, b)=(a", b') =(aU, DU), 


es decir, la aplicación Y es unitaria. 

Examinemos el problema acerca de la transiormación de coorde- 
nadas en los espacios unitarios. Sea e,, €,, ..., €, una base orto- 
normal de un espacio unitario Y y sea YU una aplicación unitaria 
cualquiera de este espacio. Puesto que una aplicación unitaria no 
altera las longitudes de los vectores y transforma los vectores orto- 
onales en ortogonales, el sistema e,U, e,U, ...,e,Userá de nuevo una 
hase ortonormal de £, Recíprocamente, supongamos que una aplicación 
lineal U transforma una base ortonormal e,, €, ..., €, en una 


IS * 
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base también ortonormal e,Ul, e,U, ..., e,U. Tomemos en £ unos 
vectores arbitrarios 


A=0/e, FO tn Y OZ Be Pet. +B,2a. 
Tenemos 


(a, b)= (Ya, YB) = ap, +0, +... + Bn, 
(aU, HyU) = 0) ae U, > B.eU) > ab, +2, + ... + GB. 


es decir, (a, b)=(aU, bU); luego, la aplicación U es unitaria. Por 
consiguiente, para que una aplicación lineal YU sea unitaria es nece- 
sario y suficiente que U transforme una base ortonormal en una 
base ortonormal, 

De aquí también se desprende directamente la proposición siguien- 
te: la matriz del cambio de una base ortonormal por otra es uni- 
taria y, viceversa, si una de las bases es ortonormal y la matriz 
del cambio es unitaria, la otra base es también ortonormal. 

Para Ja demostración basta observar que la matriz del cambio 

de un sistema de coordenadas por otro coincide con la matriz de 
a O lineal que transforma el primer sistema en el segundo 
p. 8.3). 
Notemos, finalmente, que de la definición de las aplicaciones 
unitarias se deducen fácilmente las siguientes propiedades de las 
mismas: 1) la aplicación idéntica es unitaria, 2) el producto de apli- 
caciones unitarias es unitario y 3) la inversa de una aplicación uni- 
taría es una aplicación unitaria. 


19,2, Equivalencia unitaria. Ligado de un modo 'nafural al 


concepto de aplicación unitaria aparece uno de los problemas prin- 
cipales de la teoría de espacios unitarios. Se trata de la clasificación 
de las aplicaciones lineales de estos espacios. Sean £ y , unos 
espacios unitarios sobre un mismo campo principal K. Consideremos 
dos aplicaciones lineales 4 y A, de estos espacios con la particu- 
laridad de que 4 actúa sobre *, mientras que 4, actúa sobre %,. 
Las aplicaciones 4 y 4, se llaman semejantes o isomorfas si existe 
una aplicación isomorfa de € sobre *, que transforme la aplicación 
vt en la aplicación 4, Puesto que todos los espacios unitarios son, 
salvo un isomorfismo, conocidos z se determinan por su dimensión n, 
podemos aceptar que *, coincide con Y y, que, por consiguiente, 
las aplicaciones 4 y A, actúan sobre el mismo espacio £. En este 
caso nuestra definición significa que 4 y 4, son isomorfas cuando, 
y sólo cuando, existe una aplicación isomoría YU del espacio Y 
sobre sí mismo que transforma 4 en 4,. Como hemos visto en el 
p. 10.2 esto equivale a la condición 


A y =UNTAU. (7) 
Si tomamos en £ un sistema ortonormal de coordenadas, la relación (7) 
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puede ser representada en la forma matricial 
A, =U-1AU, (8) 


donde U es una matriz unitaria y A y A, son las matrices de las 
aplicaciones lineales dadas. Unas matrices A y A, que satisfacen 
la relación (8) se llaman unitariamente equivalentes. Por consiguiente, 
las aplicaciones lineales de un espacio unitario son isomorfas cuando, 
y sólo cuando, sus matrices, calculadas en una base ortonormal, son 
unitariamente equivalentes. 

Considerando la matriz U de la relación (8) como una matriz 
de cambio, llegamos a la siguiente proposición: unas aplicaciones 
lineales A y B de un espacio unitario L son isomorfas cuando, y sólo 
cuando, en Y existen dos bases ortonormales tales que la matriz de 
ta aplicación A calculada en una de ellas coincide con la matriz de 
la apticación HB calculada en la otra. 

sta proposición es totalmente análoga a la correspondiente 
afirmación para espacios lineales arbitrarios que ha sido considerada 
en el p. 10.2, donde se ha dado también una demostración detallada. 

A título de ejemplo, podemos tomar las aplicaciones normales, 
Está claro que para que unas aplicaciones lineates de un espacio 
unitario sean unitariamente isomorfas es necesario que sean isomorfas 
linealmente, es decir, que sean isomorfas como aplicaciones lineales 
de un espacio lineal. Por ello, para que unas aplicaciones lineales 
sean unitariamente isomorfas es necesario que sus polinomios carac- 
terísticos coincidan. Si las aplicaciones dadas son normales y las 
raíces de sus polinomios característicos son conocidas, es posible, 
según el punto anterior, escribir las matrices de estas aplicaciones 
en unas bases ortonormales del espacio convenientemente escogidas. 
Puesto que estas matrices resultarán idénticas, las aplicaciones serán 
unitariamente isomorfas. Hemos demostrado,pues,el siguiente teorema: 

TEOREMA 1. Para que unas aplicaciones normales de espacios unita- 
rios, tanto reales como complejos, sean unitariamente isomorfas es 
necesario y suficiente que los polinomios característicos de estas apli- 
caciones coincidan. 

En una forma puramente matricial el teorema 1 puede ser 
enunciado del siguiente modo: 

TEOREMA la. Para la equivalaencia unitaria de unas matrices A y B 
que conmutan con sus matrices risa dir complejas A y B' 
es necesario y suficiente, tanto en el caso del cuerpo de los números 
complejos como en el caso del cuerpo de los números reales, que los 
polinomios característicos de las matrices A y B coincidan. 

En particular, para toda matriz compleja o real A, tal que 
AÁA'=A'A, existe una matriz unitaria U compleja o, respectiva- 


mente, real tal que la matriz UAU-=* =UADT' es diagonal en el 
caso complejo y tiene la forma (16) del p. 18,3 en el caso real. 
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Por consiguiente, el isomorfismo unitario de las aplicaciones 


normales resulta ser equivalente al isomorfismo corriente de las 
mismas. 


19.3. Forma normal de la matriz de una aplicación unitaria. 


Como ya hemos señalado, las aplicaciones unitarias son un caso 
particular de las normales. Por esto los teoremas ] y la, además 
de ofrecer las condiciones necesarias y suficientes para que un iso- 
morfismo sea unitario, ofrecen también la forma normal para las 
matrices de las aplicaciones unitarias. El teorema que sigue indica 
el rasgo característico que distingue las aplicaciones unitarias de 
las demás aplicaciones normales: 

TEOREMA 2, El módulo de todas las raíces del polinomio caracte- 
rístico de una aplicación unitaria es igual a la unidad. 

Consideremos primero el caso complejo. En este caso a toda 
raíz a del polinomio característico de una aplicación unitaria “UU 
le corresponde un vector propio no nulo a. De las relaciones 


aU=aa y (AU, AU) =(a, a) 
resulta 


(ua, aa) =ac (a, a)=(a, a), 


es decir, au =|a|t= 1. 
En el caso real, a toda raíz compleja a =p-+i0 le corresponde 
un par a y b de vectores ortogonales no nutos tales que 


au =pa—ob y BU = 00 + pb. 
De aquí tenemos 


(a, a)+(b, b) =(aU, aU) + (0U, HU) == (p* + 0%) ((a, a) +(b, b)), 


es decir, 
po]. 


Observando que entre los números reales sólo los números 1 

y —i son de módulo igual a la unidad, podemos enunciar el teo- 

rema la en el caso de aplicaciones unitarias en la forma siguiente: 

TEOREMA 3, Para toda matriz unitaria A existe una matriz uni- 

taria compleja U tal que UAU-”* será una matriz diagonal con 

elementos diagonales de módulo igual a la unidad. Para toda matriz 
unitaria real Á existe una matriz unitaria real U tal que 

cos q, sen p, 

UAU E H—Ep+ | — sen Q, a 


COS P. Sen, 
+ | — SEN P, COS al , (9 
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donde E, y E, son matrices unidades de orden s y t, respectivamente, 
y senp,+0 (¡=1, ..., m), con la particularidad de que algunos 
de los números s, t y m pueden ser iguales a cero, es decir, en la 
fórmula (9) pueden no figurar los términos correspondientes. 

Consideremos, a título de ejemplo, el espacio euclideo corriente 
'de tres dimensiones M. Para toda aplicación ortogonal U del espacio 
M se puede encontrar, de acuerdo con el teorema 3, un sistema 
€1 € y €, de vectores perpendiculares unitarios tal que la matriz 
de la aplicación U tomará una de las seis formas siguientes: 


PEPE 


—|] 1 —1 

8) —=1 |, 2) cospsenQ | y x=) cosp seno |. 
—] —sen y cos f —Sen p Cos q 
Es evidente que ta aplicación U es la aplicación idéntica en el 
caso a), la reflexión especular respecto al plano e,Oe, en el caso PB), 
la reflexión especular respecto a la recta Oe, en el caso y), la 
reflexión especular respecto al origen O en el caso 6), la rotación 
de ángulo q alrededor del eje e, en el caso e) y la rotación de 
ángulo q alrededor del eje e, ee po de la reflexión especular respecto 
al plano e,Oe, en el caso x). Los cuatro primeros casos se pueden 
considerar como casos particulares de los dos últimos con g=0 y 
p=1. 


19.4. Aplicaciones simétricas. Una aplicación lineal 4 de un 


espacio unitario Y se Tlama hermitiana o simétrica, si 4 coincide 
con su aplicación conjugada 4”. Es decir, si la aplicación 4 es 


simétrica, se tiene 
(xA, y) =(x, yA). (10) 


Reciprozamente, si una aplicación lineal 4 satisface la condición (10) 
cualesquiera que sean x € y de Y, la aplicación .4 es simétrica. 

Es evidente que de la condición 4*=4 se deduce la igualdad 
AA*'=A*A, es decir, las aplicaciones simétricas son aplicaciones 
normales. 

Tomemos en Y una base ortonormal y sea A la matriz de una 
aplicación simétrica 4. La matriz de la aplicación conjugada A” 
es igual en esta base a la matriz anticonjugada A”. Tenemos, por 
hipótesis, 4*= 4, de donde 

A'=4. (11) 


Reciprocamente, de (11) se deduce que .4* = 4, es decir, que 4 
es simétrica. Las matrices que satisfacen la relación (11) han sído 
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lamadas en el p. 1.3 hermitianas. Por consiguiente, en una base 
ortonormal a las aplicaciones simétricas tes corresponden matrices 
hermitianas y, viceversa, a las matrices hermitianas les corresponden 
las aplicaciones simétricas. 

El ejemplo más sencillo de aplicación simétrica es la aplicación 
de tipo ag$', donde a es real. El ejemplo general se obtiene con las 
aplicaciones cuyas matrices tienen, en una base ortonormal, la forma 
diagonal real. , 

La suma de aplicaciones simétricas y el producto de una aplicación 
simétrica por un número real son de nuevo aplicaciones simétricas. 

En efecto, si las aplicaciones 4 y 3 son simétricas y a es un 
número real, se tiene 


AFB = A BP APR, 
(24) =04*=04. 
El producto de dos aplicaciones simétricas es una aplicación si- 


métrica cuando, y sólo cuando, estas aplicaciones son conmutabtes. 
Efectivamente, de AB=BA. A=4A" y B="3B" se deduce que 
(AB = ZA == BA = AR. 
Reciprocamente, si (AB =4BD, —A=A* y B=SB", se tiene 
AB=(ARBY =B' A* = BA. 
De aquí se deduce, en particular, que las potencias de una aplica- 
ción simétrica y, en general, los polinomios de coeficientes reales 
en una aplicación simétrica son de nuevo aplicaciones simétricas. 
Los valores propios de las aplicaciones simétricas soñ reales. 
Efectivamente, sea 4 una aplicación simétrica, sea a un valor 
propio de la misma y sea a un vector propio no nulo correspondiente, 
enemos _ 
(a, aA)= (a, aa) =a (a, a), 
(aA, 4) =(as, a)=4 (a, a). 
Pero 
(a, a4A) =(04A, a). 


Comparando estos resultados, vemos que «:=«a, es decir, que a es 
real. 

Todas las raices del polinomio característico de una matriz hermi- 
tiana son reales. 

En efecto, toda matriz hermitiana A puede ser considerada como 
la matriz de una aplicación simétrica 4 de un espacio unitario. 
Las raíces del polinomio característico de la matriz A son los va- 
lores propios de la aplicación 4 y, por consiguiente, son reales. 

Hemos señalado anteriormente que las aplicaciones simétricas 
son normales. Por lo tanto, para que unas aplicaciones simétricas 
sean unitariamente isomorías es necesario y suficiente, en virtud 
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del teorema 1, que los polinomios característicos de estas aplica- 
ciones coincidan. 

Para toda aplicación normal de un espacio unitario complejo 
existe, según el teorema 6 del p. 18,3, una base ortonormal en la 
que la matriz de la aplicación es de forma diagonal. Puesto que 
todos tos valores propios de las aplicaciones simétricas son reales, 
la matriz diagonal indicada será real en el caso de aplicaciones 
simétricas; obtenemos así el teorema siguiente: 

TEOREMA 4 Toda aplicación simétrica de un espacio complejo uni- 
tario tiene, en una base ortonormal adecuada, una matriz diagonal real. 

La recíproca es támbién válida, ya que si la matriz de una 
aplicación lineal 4 en una base ortonormal es de forma diagonal 
real A, se tiene A"=A y por consiguiente, 4*=4. 

En términos matriciales el teorema 4 puede ser enunciado de 
la forma siguiente. 

TEOREMA 4a. Para toda matriz hermitiana A existe una matriz 
unitaria compleja U tal que la matriz UAU”* es de forma diago- 
nal real. 

Consideremos ahora el caso en que 4 es una aplicación simé- 
trica de un espacio unitario real. Según el teorema 8 del p. 18.3, 
la matriz de la aplicación .4 se descompone, en una base ortonor- 
mal adecuada, en células de orden | ó 2. Además, las células de 
orden 2 aparecen sólo cuando el polinomio característico de la 
aplicación tiene raíces no reales. Pero los polinomios característicos 
de las aplicaciones simétricas no tienen raíces que no sean reales. 
Por consiguiente, también en el caso real la matriz de una aplica- 
ción simétrica se reduce a la forma diagonal en una base ortonor- 
mal adecuada. La recíproca, obviamente, es también válida, de 
modo que tiene lugar el teorema siguiente: 

TEOREMA 5. Para toda aplicación simétrica de un espacio unitario 
real existe una base ortonormal en la que la matriz de la aplicación 
adquiere la forma diagonal. 

En una base ortonormal las matrices de las aplicaciones simé- 
tricas satisfacen las relaciones A'=A. En el caso real está relación 
se convierte en la igualdad A'= A. Las matrices que satisfacen esta 
igualdad se llaman simétricas (p. 1.3). Por consiguiente, en una 
base ortonormal las matrices de las aplicaciones simétricas reales 
son simétricas y, viceversa, las aplicaciones son simétricas si sus 
matrices son simétricas reales. Esta observación permite enunciar 
el teorema 5 del modo siguiente. 

TEOREMA $8. Para toda matriz simétrica real Á existe una matriz 
unitaria real U tal que la matriz UAU”1! es de forma diagonal. 


19.5. Aplicaciones antisimétricas. Sea Y un espacio unitario. 
Una aplicación lineal 4 se llama antisimétrica, si está ligada a su 
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aplicación conjugada por la relación 
A =— A. (12) 
Siendo a y b vectores arbitrarios de Y, de (12) se deduce que 
(a, bA)=(a4*, bd) =— (at, b). 
Recíprocamente, si para cualesquiera a y b se tiene 
(a, DA) == — (at, 0), 


resulta que 4=-— A” y 4 es una aplicación antisimétrica. 

En el caso en el que el campo pa es el cuerpo de los 
números complejos, las aplicaciones antisimétricas tienen una expre- 
sión muy sencilla mediante las simétricas. En efecto, sea 4 una 
aplicación simétrica de un espacio Y. Entonces 


(¡AY =1Í4 =— iA, 
es decir, la aplicación ¿4 es antisimétrica. Reciprocamente, si la 
aplicación A es antisimétrica, se tiene 
(AP =i¡4A =i4A, 
y, por consiguiente, la aplicación ¡4 es simétrica. En los espacios 
reales esta relación desaparece. 

Tomemos una base ortonormal en un espacio unitario % e indi- 
quemos por A la matriz de una aplicación antisimétrica 4. Puesto 
que la matriz de la aplicación conjugada «4* es igual a A', la 
condición (12) da 


A=—A. (13) 


Viceversa, de (13) se deduce, obviamente, que 4 es una aplicación 
antisimétrica. Las matrices que verifican la relación (13) se llaman 
matrices hermitianas antisimétricas. Por consiguiente, en una base 
ortonormal a las aplicaciones antisimétricas les corresponden las mat- 
rices hermitianas antisimétricas y, viceversa, a Jas matrices hermi- 
tianas antisimétricas les corresponden aplicaciones antisimétricas. 

De la relación (12) se deduce directamente que la suma de apli- 
caciones antisimétricas y el producto de una aplicación antisimétrica 
por un número real son de nuevo aplicaciones antisimétricas. 

Todo valor propio de una aplicación antisimétrica o bien es igual 
a cero o bien es un número imaginario puro. 

Si a es un valor propio de una aplicación antisimétrica 4 y a 
es un vector propio no nulo correspondiente, se tiene 


(a, a4A)=(a, aa) =a(a, a, 
(ad, 4) == (aa, a) =«(a, a). 


Pero (a, aA)=-—(a4t, a) y, por consiguiente, —a=u que es lo 
que se quería demostrar. 
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En particular, de aquí resulta que foda raíz del polinomio ca- 
racterístico de una matriz hermitiana antisimétrica o bien es ¡gual 
a cero o bien es un número imaginario puro. 

Puesto que de la relación 4*=-— A se deduce inmediatamente 
la igualdad 4%4=A4A4A”, las aplicaciones antisimétricas resultan ser 
un caso particular de las aplicaciones normales y, por ello, para 
hallar la forma más sencilla de las matrices de las aplicaciones 
antisimétricas es suficiente recurrir al teorema 8 del p. 18.3. Así se 
obtiene el teorema siguiente: 

TEOREMA 6 En una base ortonormal adecuada de un espacio uni- 
tario real la matriz Á de una aplicación antisimétrica toma la forma 


. 0 al. ; 0 Un 
A=0,+ Me Rel Ed, (14) 
donde O, es la matriz nula de orden k, 

Efectivamente, en una base ortonormal adecuada la matriz de 
la aplicación dada se descompone, según el teorema mencionado, 
en células de órdenes 1 y 2. De la relación (13) se ve que también 
las células aisladas deben satisfacer esta misma igualdad. Las células 
de orden | son números reales p, y la relación (13) da para ellas 
p,=—p¡=—Ppy es decir, p¿¡=0. En cambio, si la célula es de 
orden 2, de (13) resulta que debe ser de la forma 


A 0 A 
q —0) 0 


que es lo que se quería demostrar. 

En términos matriciales el teorema 6 se puede enunciar de modo 
siguiente: 

TEOREMA 6. Para toda matriz antisimétrica real A existe una 
matriz unitaria real U tal que la matriz UAU-1! es de In forma (14). 

Para las matrices reales los conceptos de matriz unitaria y de 
matriz ortogonal son equivalentes y por esto en los teoremas 5a y 6a 


las palabras unitaria real pueden ser sustituidas por las palabras 
unitaria ortogonal. 


19.6. Aplicaciones simétricas no negativas. Una aplicación simé- 
trica «£ de un espacio unitario Y se llama no negativa, si para todo 
x de £ se tiene 

(xA, x) >0. (16) 

Aquí el signo de desigualdad tiene sentido, ya que en el caso 
de aplicaciones simétricas el producto escalar (x4, x) es siempre 
real. Si el signo de igualdad tiene lugar en (15) sólo para el vector 
nulo, se dice que 4 es una aplicación posttiva o definida positiva. 

Una combinación lineal de aplicaciones no negativas con coeficientes 
reales no negativos es una aplicación no negativa. 
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Esto se ve directamente de la fórmula 
(x(AAF+ PB), x)=0(xA, 9) +4B(X3B, x). 


El producto de cualquier aplicación lineal por su conjugada es 
una aplicación simétrica no negativa. 
Efectivamente, 
AA”, x)=(x4, xA) 0, 
AAA, x)=(xA—A", xA*) >0. 


El cuadrado de cualquier aplicación simétrica es una aplicación 
no negativa. 

Resulta de la anterior, ya que toda aplicación simétrica es con- 
jugada de sí misma. 

Todos los valores propios de una aplicación no negativa son reales 
y no negativos. 

Sea 4 una aplicación no negativa, sea q un valor propio de la 
misma y sea a un vector propio no nulo correspondiente. Entonces 


(aA, a)=a (a, a) >0. 
Por consiguiente, se tiene a. >0. 


Si los valores propios de una aplicación simétrica de un espacio 
unitario *, complejo o real, son no negativos, la aplicación es no 


negativa. 
En £ existe, en virtud del p. 19.4, una base ortonormal e,, ..., €, 
formada por los vectores propios de la aplicación 4. Sean a,, ..., a, 


los valores propios correspondientes y sea 
x=Eje, + Es€, + Sa + Entn 
un vector arbitrario de £. Entonces 


(XA, x)= at, + a, 8, + ... + a, En En = 
=04) JE, +... +0,)5,1* >0 (16) 


que es lo que se quería demostrar. 

El determinante de la aplicación 4 es igual a a,%, ... a,. Si él 
es diferente de cero, todos los números a, son mayores que el cero 
y la suma (16) será igual a cero en este caso sólo para x=0. Por con- 
siguiente, la aplicación 4 será en este caso definida positiva. 
En cambio, si | 4]=0, uno de los valores propios, digamos «,, es 
igual a cero. Entonces 

(e, A, e.) =0(8,, e,) =0 
y la aplicación A no será definida positiva. 

Por consiguiente, una aplicación simétrica no negativa es definida 

positiva cuando, y sólo cuando, es regular. 


Consideremos ahura la operación de extracción de la raiz cuad- 
sada de una aplicación lineal. Se dice que una aplicación lineal Z 
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es raíz cuadrada de una aplicación lineal 4, si 

Ti=A. (17) 
Según sea la aplicación 4, la ecuación (17) puede no tener solu- 
ciones, puede tener sólo un número finito de soluciones y puede tener 
un número infinito de soluciones. Sin embargo, en el caso de apli- 
caciones simétricas no negativas la situación es bien determinada. 

TEOREMA 7. Para toda aplicación simétrica no negativa A de un 

espacio unitario existe una aplicación simétrica no negativa 3, y solo 
una, que cumple la relación 

D=A. 


Toda aplicación lineal que conmuta con A es conmutable con 3. 

DEMOSTRACIÓN. Tomemos en * una base ortonormal e,, ..., € 
formada por los vectores propios de la aplicación 4. Tal base existe 
de acuerdo con el p. 19.4. Indiquemos por «,, ..., «, los valores 
propios correspondientes de la aplicación 4. Sea 3 la aplicación 
linea) que transforma e, en Vag, (¡=1, ..., n), donde se toman 
los valores no negativos de los radicales. Puesto que e,, ..., €, es 
una base ortonormal formada por los vectores propios de la apli- 
cación B y puesto que los valores propios de ésta son iguales a 

Qi» »--y Y An, es decir, son no negativos, resulta que Y es una 
aplicación simétrica no negativa. Pero 
e =0 £,=e 4 (=1l,..., 12). 
Por lo tanto, 3*=w4. Hemos demostrado que la raíz cuadrada 
requerida de 4 existe. 

Demostrernos la última afirmación del teorema. Sea .2 una apli- 
cación lineal que conmuta con 4. Tomemos los vectores coordenados 
€,» -.-» €, en tal orden que los valores propios iguales, si es que 
existen, correspondan a vectores coordenados adyacentes. Entonces 
las matrices de las aplicaciones 4 y %B serán, respectivamente, de 


la forma 

CoaE, A 

ay, 
A= y 
as a,E, 10] 

Va,E, 

V oAE, 
B = á 
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donde x,, ..., %, Son distintos valores propios de la aplicación «4 y 
E,, ..., E, son matrices unidades. Representemos la matriz de la 
aplicación .7 en la forma celular correspondiente 


An Ars. Xy 
X= Xu X ss AOS Xes 


Xi a rr a 
De la condición AX =XA tenemos 


AX n= X ¡ne (Í, Rh eo 1, 2, | s), 
es decir, 
(2,—as) X ¡p=0. 


Puesto que «ya, para ¡«4k, tenemos X ,¿=0 (¡7 k). Por consi- 
guiente, 


X.1 0 ... O 
X= O Ai «e 0 l 
0.00 ...XA, 
pero entonces 
Va Xy 
BX = ; =XB 
Va,Xy 3 


que es lo que se quería demostrar. 

Resta demostrar la unicidad. Sea $ otra aplicación simétrica 
no negativa tal que 6*=.4. Correspondientemente a la descompo- 
sición celular de la matriz A señalada anteriormente, el espacio £L 
se descompondrá en la suma directa de los subespacios invariantes 
£/(J=1,...,s). Puesto que 64 =48, los subespacios Y, serán 
también invariantes, de acuerdo con lo demostrado, respecto a €. 
Como $8 es simétrica, en cada uno de los subespacios Y, existe una 
base ortonormal formada por los vectores propios de 8. Sean 
Var ++.» Yip los valores propios correspondientes. Indiquemos por 
Aj B, y e, las aplicaciones inducidas en el subespacio %, por las 
aplicaciones 4, H y €, respectivamente, tenemos 


Aj206) 3/=Vas, y Ci=u jo 
de donde 


Va=... =Y)=0) 
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Puesto que todos los números Y;, ..., Y ¡p SOn no negativos, de aquí 
se deduce que 


Yh= ... = Y =V a) 


y, por consiguiente, 8,=V a,8,=3B),, es decir, 8 =83. 
Demostremos, como ejemplo de una aplicación directa del teorema?7, 


que el producto de aplicaciones simétricas no negativas conmutables 
es una aplicación no negativa. 

En efecto, sean 4, y 4, unas aplicaciones simétricas no dol 
tivas que conmutan. Indiquemos por 8, y 4, sus raíces cuadradas 
que, según el teorema 7, se pueden escoger de manera que conmuten 
y que sean simétricas y no negativas. Tenemos entonces 


(2,3, => BBB R, => BB; = A As, 


es decir, 4,4, es igual al cuadrado de una aplicación simétrica 9,B,. 
Luego, 4,4, es no negativa. Hemos demostrado la proposición. 

De ella se desprende, en particular, que los polinomios con coe- 
ficientes reales no negativos en una aplicación simétrica no negativa 
son también aplicaciones simétricas no negativas. 


Ejemplos y problemas 


|, Sea €,, € y €, una base ortonormal de un espacio unitario Y. Hállense 
las matrices de las aplicaciones unitarias que transforman los vectores e, y e, en 


2 1 2 1 2 
los vectores Fat3t—>3t Y Fa=7 att 


2. Si Gi, .... Am Y dy, -.., 6 son dos sistemas ortonormales de vectores 
de un espacio unitario e de n dimensiones (m «<< n), existe una aplicación unitaria 
de L£ que transiorma el primer sistema en el segundo. 

3. Para que un sistema de vectores a,, ..., G de un espacio unitario pueda 
ser transformado por una aplicación unitaria en otro sislema b,, ..., es 
necesario y suficiente que las matrices de Gram de estos sistemas colncidan 
(véase el problema 6, pág. 215). 

4. Demuéstrese, empleando la furma normal de Jordan y el proceso de orto- 
normalización de Gram—Schmidt, que la matriz de toda aplicación Jineal de 
un espacio unitario puede ser reducida a la forma triangular en un sistema de 
coordenadas ortonormal adecuado (teorema de Schur). 

5. Demuéstrese que siendo 4 una aplicación arbitraria de un espacio uni- 
tario € que conserva los valores de los productos escalares, la aplicación 4 es 
lineal y es, por consiguiente, una aplicación unitaria del espacio £. 

n un espacio lineal existen, salvo un isomoriismo, sólo dos funciones 
lineales. En un espacio unitario las funciones lineales son, salvo un isomorfismo, 
de la forma a (x, e), donde e es un vector unitario fijo. 

7. En una base ortonormal de un espacio euclideo las matrices de las apli- 
caciones A, Y y € son iguales respectivamente a 


524 424 134 
2221, |212| y |-1 221]. 
425 424 102 
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Demuéstsese que 4 es definida positiva, que .Y es no negativa y que €, 
aun no siendo simétrica, es tal que (x8, x)=>0 cualquiera que sea x. 

8. Hállese la raíz cuadrada simétrica no negativa de la aplicación H del 
problema anterior. 

9. La matriz de una aplicación simétrica no negativa, calculada en una base 
ortonormal, se llama hermitiana no negativa. Pruébese que una matriz hermitiana 
es no negativa cuando, y sólo cuando, se alternan los AOS de Jos coeficientes 
de su polinomio característico. Además, si uno de los coeficientes es igual a cero, 
también tienen que ser iguales a cero Jos coeficientes de los términos de grado 
menor. 

10. Demuéstrese que de toda aplicación normal 4 se puede extraer la raíz 
de cualquier grado positivo n, es decir, demuéstrese que para toda aplicación 
normal A existe una aplicación normal ,2 que satisface la relación 27? = 4. 
¿Cuál es el número máximo de tales aplicaciones ,27? 

11. En un espacio unitario € se ha tomado una base ortorormal. Demuéstrese 
que en esta base la matriz de toda aplicación simétrica no negativa 4 de rango 
1 puede ser representada en la forma 

A =1x]" [x), 


donde [xj es la fila coordenada de un vector x convenientemente escogido. 

12. Toda aplicación simétrica no negativa es una suma de aplicaciones simé- 
tricas no negativas de rango 1. 

13. Si unas matrices hermitianas de elementos ay y B;,y son no negativas, 
la matriz de elementos y,, =a;¡¡P¡y es también no negativa (i, j=1, 2. .... a). 
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Las aplicaciones unitarias, simétricas y antisimétricas tienen una 
estructura geométrica muy clara. Por esto al estudiar las aplicacio- 
nes lineales generales de espacios euclídeos o unitarios resulta na- 
tural preguntarse si es posible expresar de algún modo simple estas 
aplicaciones en términos de las aplicaciones especiales mencionadas. 
Algunos de estos métodos, que son de importancia principal, se 
consideran precisamente en este parrágrafo. 


20.1. Descomposición en partes simétrica y antisimétrica. Sea Y un 


espacio unitario complejo y sea 4 una aplicación lineal del mismo. 
Designernos 


BFUARA) y Cszld— A". (1) 
Tenemos 
BAP A)=B y C=—q (A —A)=€. 
Por consiguiente, 8 y 8 son simétricas. De (1) resulta 
A=3B3B+1€. (2) 


£s decir, toda aplicación lineal A de un espacio unitario complejo 
puede ser representada en la forma (2), donde HB y € son aplicaciones 
simétricas. Esta representación es unívoca, ya que de (2) se deduce 


que 
A = HG — 16" =3B-—18, 
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de donde obtenemos para 3 y $8 de nuevo las expresiones (1). 
Si el campo principal es real, la descomposición (2) no sirve. 


En este caso se procede del modo siguiente. A una aplicación 
arbitraria. Pongamos 
DezlA+ A) y E=z(A—4" (3) 


De aquí resulta 
4=3+6. (4) 
Puesto que 


PA) y C=z (A A) =—8, 


en la descomposición (4) 3 es una aplicación simétrica y $ es una 
aplicación antisimétrica. La descomposición (4) es univoca, ya que 
de ella se deduce que 4*=B— y de aquí obtenemos para 3 y 8 
de nuevo las expresiones (3). Por consiguiente, toda aplicación lineal 
puede ser representada como la suma de una aplicación simétrica y 
una aplicación antisimétrica. Esta representación es univoca. 

Es evidente que la descomposición (4) sirve cualquiera que sea 
el campo principal. La aplicación B se llama parte simétrica y la 
aplicación -6 se llama parte antisimétrica de la aplicación 4. 

Desde el punto de vista del cálculo de matrices, la descompo- 
sición (2) significa que toda matriz cuadrada A se puede representar 
en la forma B+¿C, donde B y C son matrices hermitianas, mient- 
ras que la descomposición (4) significa que toda matriz cuadrada A 
puede ser representada en la forma B+C, donde B es una matriz 
simétrica y C es una matriz antisimétrica. 


20.2. Descomposición polar. Desde el punto de vista geométrico 
es de mucho mayor interés la representación de una aplicación lineal 
como el producto de unas aplicaciones simétrica y unitaria. La po- 
sibilidad de tal representación se basa en el lema siguiente. 

LEMA. Sí las aplicaciones lineales A y B de un espacio unitario Y 
alteran igualmente las longitudes de los vectores*, es decir, si para 


cualquier a 
(ad, art) = (a$H, ad), (5) 


existe una aplicación unitaria U del espacio Y tal que AU =2H. 
"Consideremos el dominio de valores de la aplicación 4, es decir, 
el conjunto de vectores de tipo x4, donde x recorre todo el espa- 
cio Y. Indiquemos por YA este dominio. Análogamente, indiquemos 
por Y el dominio de valores de la aplicación 3. A y D son, según 
el p. 10.1, unos subespacios lineales. Queremos, ante todo, establecer 
una correspondencia isomorta entre 9 y B. Sea a un vector de Al. 


2) Las aplicaciones A y B que poseen esta propiedad se llamen métricamente 
iguales. 


16—1843 


242 Cap. V. Espactos unttarios y euclideos 


Busquemos en * un vector x tal que x4=a y tomemos x48 =06. 
Convengamos en decis que b es la imagen de a y en indicarla por a$?. 
Probemos que a determina univocamente a b. En efecto, lo contra- 
rio puede acontecer sólo si el vector x no se determina unívoca- 
mente por la condición x4 =«a. Sin embargo, si x, es otro vector 
tal que x,4=a, tenemos (x—x,) 4 =0. De aquí se deduce, en 
virtud de (5), que 


(13D, (x—x,) B) =((1—x,) A, (1x—x,) 4) =0, 


es decir, que (x—x,))B=0 Ó x,8=x2B que es lo que se quería 
demostrar. Hemos probado de esta forma que 3? es una aplicación 
unívoca de A en B. Sin embargo, es fácil ver que Y? es una apli- 
cación biyectiva de Y sobre YN. Efectivamente, siendo b un vector 
de Y, existe en Y un vector x tal que x32=b6b. Tomando entonces 
xA =a, tendremos aY? =b que es lo que se quería demostrar. 

De la misma definición de la correspondencia Y? se desprende 
que para todo vector x de Y es válida la igualdad 


XA =x3. (6) 


Empleando esta igualdad se puede probar que Y? es una aplicación 
isomorfa de A sobre Y. Efectivamente, sean a, y a, unos vectores 
de Y. Busquemos en Y unos vectores x, y x, tales que x,4=a, y 
x,A =4,. Tenemos entonces 


(aa, + Pas) Y =(ax,A + PxA) Y? = (0%, + Bxp) AP =(0x, + Px,) B= 
20 (BD) +8 (2,B) =0 (1, AY) + Blx AY?) =00, 9 4 Ba,P, (7) 


es decir, la aplicación Y? conserva las operaciones de adición y de 
multiplicación por número. Además, 


(AP, AP) = (AO, AV =(,B, x,B) = 
= (x,4, x A) = (a,, a,), (8) 


es decir, la aplicación Y? conserva las longitudes de los vectores. 
Por consiguiente, Y? es un isomorfismo. 

Tenemos definida la aplicación Y? sólo para los vectores de 9. 
Queremos ahora definirla también en todos los demás vectores del 
espacio Y, Con este fin consideremos los subespacios ortogonales 
Al y Bl. Para * son válidas, de acuerdo con el p. 17.5, las des: 
composiciones directas 


£=29 491 =8 49D, 


Los subespacios A y B son isomoríos y, por lo tanto, tienen la 
rrisma dimensión. Pero entonces los complementos ortogonales 914 
y Bl también tienen la misma dimensión. Como los espacios uni- 
tarios de una misma dimensión son isomortas, debe existir una 
aplicación biyectiva de AL sobre BL que conserva las operaciones 
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a Te 


de adición y de multiplicación por número y que no altera las ton- 

gitudes de los vectores. Indiquemos esta aplicación por %W”. Luego, 

si a” y a” son unos vectores de 9, los vectores a” y a"Y” per- 
tenecen a Bl y 

(aa + Pa”) Y =a (a) 4- B (a), (9) 

(AR, AH) =(a", ad). (10) 


Definamos ahora una aplicación U del espacio Y del modo siguiente. 


Sea x un vector cualquiera de £. Puesto que L=YU+9YU!, el vector x 
se puede representar univocamente en la forma 


x=xX+x (xEed y xE941). WIN 
Tomemos, por definición, 
XU PAR. a (12) 


La aplicación U es lineal, ya que si 
y=y+Y (y4ed e yeA2), 
de (7), (9) y (11) resulta: 
(ax + Py) U =(ax" + Py) Y + (ax + By”) PF =0 (xU) + B (YU). 


La aplicación U es unitaria, ya que debido a (8), (10) y (11) se 
tiene 
UU, AU) = AICA, OPA) 2 
SIA, APIAAMED, CP) =WA, IA A) (x, 1). 


Para todo x de Y es válida la relación 
xAU =x%H. 


Efectivamente, r4 pertenece a U; luego, el vector x” de la descom- 
posición (11) es igual a cero y, por consiguiente, 


xAU =x44V?. 


Teniendo en cuenta (6), esto da x4U=x3. De aquí resulta 
AU=%SB y el lema queda demostrado. 

TEOREMA | Toda aplicación lineal AX de un espacio unitario Y 

admite una descomposición polar 


A == DU, (13) 


donde D es una aplicación simétrica no negativa y U es una aplicación 
unitaria del espacio %. La aplicación £D se determina univocamente. st 
Á es una aplicación regular, la aplicación U lambien se delermina 
unívocamente. 


16 * 
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La aplicación 44* es, según el p. 19.6, simétrcia y no negativa. 
Indiquemos por gD la raíz cuadrada simétrica no negativa de 44". 
Es decir, 

D*S=AA". 
Tenemos cualquiera que sea el vector x 
GA, XA )=(x, AA?) =(x, xD =(xD, 1D), 


es decir, las aplicaciónes 4 y 9D alteran igualmente las longitudes 
de los vectores. Basándonos en el lema, deducimos de aquí que 
existe una aplicación unitaria U tal que 


DU =A. 


Con esto queda demostrada la existencia de la descomposición polar. 
Resta examinar su unicidad. De (13) resulta 4*=U'D =U-E y 
AA" =£2DUU*ED =*£D*. Por consiguiente, la aplicación WD es no 
negativa y simétrica y su cuadrado es igual a la aplicación 44*. 
Según el teorema 7 del p. 19.6, estas condiciones determinan uní- 
vocamente la aplicación WD. Sí 4 es una aplicación regular, también 
£D es regular y de (13) resulta entonces que U =2D”!1.4, es decir, 
la nr “U también se determina univocamente. 
| significado geométrico del teorema 1 es muy sencillo. Indica 

precisamente que la acción de toda aplicación lineal del espacio 2 
puede ser representada de la forma siguiente: primero el espacio £ 
se dilata en n direcciones recíprocamente ortogonales con un coefi- 
ciente de dilatación concreto, real y no negativo, en cada una de 
las direcciones y después gira alrededor del origen de coordenadas '. 
Si la aplicación es regular, todos los cueficientes de dilatación son 
estrictamente positivos. En el caso de una aplicación singular algunos 
de los coeficientes resultan iguales a cero y en lugar de la dilata- 
ción en las direcciones correspondientes tiene lugar la proyección 
del espacio. 

Observemos también que en la demostración de la existencia de 
ta descomposición polar nos hemos basado en el producto 4.4”. 
Si cn lugar de él tomamos el producto .4*4, obtendremos la des- 
composición de tipo 

A =UD,, 


donde “YU es unitaria y W, es una aplicación simétrica no negativa. 

Tomemos en el espacio Y un sistema ortonormal de coordenadas. 
A las aplicaciones unitarias les corresponden entonces matrices uni- 
tarias y a las aplicaciones simétricas les corresponden matrices 
hermitianas y el teorema 1 se convierte en la proposición siguiente: 
toda matriz cuadrada puede ser representada en la forma de un pro- 
ducto de una matriz hermitiana y otra unitaria. 


1) Ei giro se entiende en el sentido de una aplicación unitaria. 
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Suponiendo que el campo principal es el cuerpo de los números 
reales, obtenemos que toda matriz cuadrada real puede ser represen- 
tada como el producto de una matriz simétrica real y otra ortogonal 
real. 

En el teorema 1 se afirma que WD es una aplicación simétrica 
no negativa. De acuerdo con esto en las dos últimas proposiciones 
a las palabras hermitiana y simétrica se puede agregar: de valores 
propios no negativos. 


20.3. Aplicación de Cayley. Comparando las propiedades de las 
aplicaciones unitarias con Jas propiedades de las aplicaciones simé- 
tricas, podemos notar que ambas clases de aplicaciones están ligadas 
estrechamente. En forma explícita esta relación queda expresada en 
las asi llamadas fórmulas de Cayley. 

TEOREMA 2 (aplicación de Cayley). Si 4 es una aplicación simé- 
trica de un espacio unitario complejo, las aplicaciones A + ig son 
invertibles; la aplicación U definida mediante la fórmula 


U =(A — IE) A+ 18)7* (14) 


es unitaria, no tiene valores propios iguales a la unidad y, además, 
Á se expresa mediante YU por la fórmula 


A=—i(U+ $) (U—6$)"". (15) 


Reciprocamente, si U es una aplicación unitaria que no tiene valores 
propios iguales a la unidad, la aplicación U—$S €s invertible, ta 
aplicación A calculada mediante la fórmula (15) es simétrica y U se 
expresa mediante A en la forma (14). 

DEMOSTRACIÓN. Sea A una aplicación simétrica de un espacio 
unitario. Los números + no pueden ser valores propios de la 
aplicación 4, ya que todos los valores propios de las aplicaciones 
simétricas son reales (p. 19.4). Esto significa que las aplicaciones 
A +16 son regulares. Puesto que las aplicaciones A+ ¡$ y 4A—18 
conmutan, resulta que ellas conimutan también con las aplicaciones 
(ARS i6Y* y (4— 18)". Para la aplicación UY definida mediante 
la fórmula (14) existe la conjugada que es igual a 


WA SIS UNA — ¿6 Y" (A — 18)" (AH 16). 
Tenemos de aquí 
UU? =(A — ¡SNA +16) (A BEA HS) 
=(A— ¡SNA HS ¡EY (AH NA iS) <=, 
es decir, YU es unitaria. Probemos que U—$ es invertible. Para 
ello restemos de ambos miembros de la igualdad (14) la aplicación £ 


y multipliquemos los resultados por 4-+ig. Después de efectuar 
transformaciones evidentes, tendremos 


(U$S lA 4 16) = 218, (16) 
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es decir, 
(U—$)"=— (A+ 18). 


Por consiguiente, U no tiene valores propios iguales a la unidad. 
Además, de (16) resulta: 


(U$S) A =—2 8 — (UE) =—1(U+S), 


A =— ¿(Ud 6) NUS)". 


Hemos demostrado la primera parte del teorema. La demostración 
de la reciproca es análoga totalmente a la demostración realizada. 
Las fórmulas de Cayley establecen una correspondencia biyectiva 
entre todas las aplicaciones simétricas de un espacio unitario £ y 
aquellas aplicaciones unitarias UY del mismo para los cuales 1 no es 
valor propio. Análogamente, las fórmulas 
U=(iS +A) US — A)7*, (14) 
A= UB) (UE) (15) 
ofrecen una correspondencia biyectiva entre las aplicaciones simét- 
ricas del espacio Y y aquellas aplicaciones unitarias U para las 
cuales —1 no es valor propio. 
Las aplicaciones (14) y (15), así como las aplicaciones (14”) 
y (15%, son posibles gracias a que en el campo principal existe el 
número ¿. Si el campo principal es real, las fórmulas indicadas no 
son válidas. Sin embargo, es fácil modificar estas fórmulas de ma- 
nera que sean válidas para cualquier campo. Tiene lugar el tecrema 
siguiente: 
TEOREMA 3. Sea A una aplicación antisimétrica de un espacio 
unitario Y. Entonces las aplicaciones A + $ son invertibles, la apli- 


es decir, 


cación 
U=(A—8) AH 8)" (17) 
es unitaria, no tiene valores propios iguales a la unidad y, ademas, 
A =—(U +8) (US$). (18) 


Reciprocamente, si U es una aplicación unitaria y la unidad no es 
valor propio de la misma, la aplicación 4 definida mediante la fór- 
mula (18) es antisimétrica y U se expresa mediante yl en la forma (17). 

En efecto, si 4 es antisimétrica, los números +1 no pueden 
ser sus valores propios, ya que todos los valores propios de las 
aplicaciones antisimétricas o 'bien son iguales a cero o bien son 
imaginarios puros (p. 19.5). Por esto las aplicaciones «1 + $ son 
regulares, Puesto que (4 +8) (4 —-$)=(4— 8) (4 +6) tenemos 
(A — 8 ) A + 68 Y"* =(4 + 6) (4— 8). De (17) resulta 

U= (AH 6)” (4*—$) = (2 AH 6)" U— Ab) = 
=(A—8) NAH 6), 
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de donde 
UU =(A— NAT EY A SYM (AH) =6, 


es decir, la aplicación YU es unitaria. Los razonamientos ulteriores 
son totalmente análogos a los realizados en la demostración del 
teorema 2 y, por ello, Jos omitirnos. 

Para concluir, observemos que los resultados de los últimos pa- 
rágrafos descubren cierta semejanza entre las propiedades de las 
aplicaciones lineales de los espacios unitarios y las propiedades de 
los números complejos. Convengamos en aceptar que las aplicaciones 
lineales son, en cierto sentido, análogas a los números complejos y 
que las aplicaciones conjugadas son análogas a los números conju- 
gados. Entonces las aplicaciones simétricas, que se caracterizan por 
la condición 4” -=4, serán análogas a los múmeros complejos que 
satisfacen la relación 2=2, es decir, a los múmeros reales; las 
aplicaciones antisimétricas, que se caracterizan por la condición 
A*= A, serán análogas a los números complejos que satisfacen a 
la relación z==— z, es decir, a los números imaginarios puros; las 
aplicaciones unitarias con la propiedad UU*=6S serán análogas a 
los números complejos 2 para los cuales 22= 1, es decir, |z|]=1. 
La descomposición 4=XBW+1¿8 del punto 20.1 corresponderá a la 
representación de un número complejo 2 en la forma cartesiana 
z=x+iy y la descomposición polar 4=2D*U corresponderá a la 
representación de un número complejo en la forma trigonométrica 
z=p(cos p + ¿sen q), etc. 


20.4, Descomposición espectral. Desde el punto de vista geométrico uno de 
los tipos más sencillos de las aplicaciones lineales es la proyección de los vec- 
tores sobre un subespacio. Algunas de las propiedades de estas aplicaciones 
proyectivas serán ahora consideradas. 

Sea 9 un subespacio lineal de un espacio unitario Y. El conjunto de vec- 
tores ortogonales a Y es el subespacio ortogonal UL y L es la suma directa de A 

Al, Luego. todo vector a de Y puede ser representado unívocamente en la 


orma 
a=a+0a” la EXA y area). (19) 


El vector a' se lama proyección del vector a sobre el subespacio YU. Poniendo 
en correspondencia a todo vector su proyección sobre A, obtenemos una aplica- 
ción del espacio £ que se Mama proyectiva y se indica por “Pp. Es decir, se 


toma por definición 
aP a ur a”. 


A veces, para abreviar la notación, omitiremos el indice Y y en lugar de (Pa 
escribiremos 0, 

Los aplicaciones proyectivas son lineales, ya que si para un vector a tiene 
lugar la descomposición (19) y para otro vector b la descomposición 


b=b0'+b"” (UEH y MEN), 
aa +80 == (aa +B0") + (aa” + Bb”, 


resulta 
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es decir, (aa + Bb) “P=aa' +Bb", de donde 
(«a +B0) P=a-aP4 BO. 
Las aplicaciones proyectivas son aplicaciones simétricas no negativas. Efecti. 
vamente, de la descomposición (19) tenemos 
(AP, a)=(a", a +0) =n(a', a) 0, 
es decir, <P es no negativa. Por otra parte, si 
b=b'+b" (yUEN y byEAL), 
tenemos 
(a, bju(a”, 040) =(a", ma Ya, b')=(a, ¿EP 


es decir, la aplicación ,P es simétrica. 
De la fórmula (19) se desprende también otra propiedad importante de las 
aplicaciones proyectivas. Es evidente que para cualquier a tenemos 


aya = a Pa a = aép, 
PP. (20) 


Las aplicaciones que coinciden con su cuadrado se llaman idempotlentes. Pot 
cuen e, de (20) resulta que todas las aplicaciones proyectivas son idempo- 
tentes. 

Reciprocamente, las propiedades de simetría y de idempotencia caracterizan 
plenamente las aplicaciones proyectivas: toda aplicación imblrica idempotente <P 
es la proyección sobre el dominio de valores de Yu 

Sea Y el dominio de valores de “P. Para todo a es válida la descomposición 


a=a:P+ a ($ —P). (21) 


El sumando aP pertenece, por definición, a Y. El segundo sumando es orto- 
nal a Y, ya que todo vector de Y es de la forma xP, donde x es un vector 
e (, y debido a que la aplicación ¿P es simétrica e idempotente lenemos 


XP, EPM =(x, EP) P)=(x, air —alp)=0. 


Por lo tanto, la descomposición (21) muestra que a? es la proyección del 
vector a sobre Y que es lo que se quería demostrar. 
Hallemos la forma más sencilla de la matríz de una aplicación proyectiva 


<P q- Tomemos en Y y en YL unas bases ortonormales €,, ..., €m Y En +rr ->- En: 
El sistema unido €,, ..., 6m» Ep+1» »-«» En Será una base ortonormal del espa- 
clo £. Las igualdades 

ejP=e y t¿P=o (fal, ..., m;¡a=mepid, ..., n) 
muestran que la matriz de la aplicación “Py en esta base es de la forma 


l 


de donde 
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Reciprocamente, si en un sistema ortonormal de coordenadas la matriz de una 
aplicación lineal CP se reduce a la forma (22), es evidente que P es una apli: 
cación proyectiva, 

Sean “P y Q las operaciones de proyección de un espacio € sobre unos 
subespacios Y Ñ B. Surge la pana ¿cómo la posición de los subespacios 
YA y 8 en £ influye en las propiedades de las aplicaciones (? y Q? Por ejemplo, 
¿qué puede decirse sobre “P y Q, si Y y B son ortogonales o si Y pertenece 
a R, elc.? Para responder a estas preguntas introduciremos, ante todo, la defl- 
nición siguiente; dos aplicaciones proyectivas y Q se llaman ortogonales, si 
PQ 6. Puesto que las aplicaciones proyectivas son simétricas, tenemos de aquí 


QP=QUP (PO =0. 


es decir, si £P es ostogonal a Q, Q es ortogonal a 07. 
Para que unas aplicaciones proyectivas há y Q sean ortogonales es necesario 
y suficiente que sean ortogonales los subespacios correspondientes U y B. 
a «FQ=6G; entonces para dEA y bEB tenemos 


(a, b)=(a,€P, bQ)=(08,PQ, b)==0, 


es decir, N es ortogonal a BD. Reciprocamente, si A es ortogonal a MB, tenemos 
para cualquier vector x de Y 


ALPEA (POP) mo y PQ0=O 
que es lo que se quería demostrar. 

Para el estudio detallado de las propiedades de las aplicaciones lineales 
suelen emplearse las representaciones matriciales de las mismos. Pero si la re- 
presentación matricial es, por cualquier razón, incómoda, se trata de expresar la 
aplicación lineal dada mediante aplicacionas de carácter más simple. En el caso 
de las aplicaciones normales, para estas aplicaciones elementales se pueden 
tomar las aplicaciones proyectivas. 

Una descomposición de tipo 


Ama PHP AR (23) 
se llama descomposición espectral de la aplicación A, si 
a) los números %y, ..., As Son diferentes; 


b) Pi=Pj%6 U=1,2 .... 5); 


c) Pie?) (¡== 1, 2, ..., s); 
d) PP =0 y k; 1, k= 1, 2, ..., s); 
e) PIERA APR E 


Las condiciones b), c) y d) significan que Pi, ..., £P, son aplicaciones 
proyectivas recíprocamente ortogonales. 

Está claro que sólo las aplicaciones normales admiten la descomposición es- 
pectral. Efectivamente, de (23) se deduce: 


A a Ed ES TES 
AA =(P a, PP APA = Y aja? = Ad. 

Reciprocamente, foda aplicación normal de un espacio unitario complejn 
admite una descomposición espectral. 

Sea A una aplicación normal de un espacio unitario complejo €. Hemos 
visto que en fl existe una base ortonormal e,, €a, .... €, formada por los vec- 
tores propios de la ción A. Ordenemos estos vectores de manera que 
aquellos que corresponden a valores propios iguales se encuentren al lado. Su- 
pongamos, por ejemplo, que €,, ..., €, corresponden al valor propio «,, que 
Emitir --:» Cm, Corresponden al valor propio «az, etc. Indiquemos por £, el 
subespacio tendido sobre los vectores ém_,+3, «... €my, Correspondientes al 
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valor proplo a; (i=1, 2, ..., s). Puesto que todos los vectores coordenados 
de £; son vectores propios correspondientes a un mismo valor propio «a, todos 
los vectores de £, serán vectores proplos con valores propios iguales a a;. Te- 
nemos 


£ == ++...+%, (24) 
donde los subespacios £,, ..., L, son reciprocamente ortogonales. Indiquemos 
or Py la aplicación de proyección sobre el Sa ero £;. Pero la ortogona- 
ida de los subespacios Y, implica la ortogonalidad de las correspondientes 
aplicaciones od Además, de la igualdad (24) se deduce que 2, + P2+ 


os =P. donde “P es la proyección sobre £. Como la proyección 
sobre Y es la aplicación idéntica, tenemos 


ESPA AA (25) 
Vemos, por consiguiente, que Jas aplicaciones A poseen las propie- 
dades de b) a e). Probemas finalmente que Pr Ts 
AA PHP RS s: 
Sea a un vector cualquiera de £, De la igualdad (25) resulta 
ama, +40 Pr +... +0aPs. (26) 
El vector a <P, pertenece a £, y todos los vectores de £; son vectores propios 


correspondientes al valor propio «y; por ello aP¡4=a;¡.a£P¡. Multiplicando 
(26) por 4, obtenemos 


at =0a,0.P,+ O + a50P,=a (AP, + ... + as. Ps), 
de ans A=AP1+... ass que es lo que se quería demostrar. 
¿ 


A=a. A TRA (27) 


es una descomposición espectral de una aplicación A, entonces Qy, .... Ag es el 
conjunto de todos los valores propios de esta aplicación. 

En electo, cualquier aplicación ,P, es, por hipótesis, diferente de la apli- 
cación 6). Por consiguiente, existe un vector a tal que a(Py o. Pero cuimno 
las aplicaciones P,, ..., ¿Ps son ortogonales, obtenemos entonces 


APA= MB PP HAMP RAE ARA PAS Za Y» 


es decir, asP, es un vector propio correspondiente al valor propto ay. 
Reciprocáamente, sea a un vector propio no nulo de la aplicación 4 corres- 
pondiente al valor propio f. De la propiedad e) se deduce que 


a=0P +0 Pr... qa Ps. (28) 


La condición (27) da: 
aA=a10.7P, +91 P1+...+052, Ps. 
Puesto que ay! = fa, tenemor 
ALP E .+040P,=Pa P4+... + Bas. 
Multiplicando esta relación por “P, y empleando tas propiedaoes c) y d) cn- 


contramos 
aya mBaP, y (aj-BaP¡=0 [¡=1, ..., 5). 


El vector a es diferente de cero y por ello al menos un sumando u(P, de (28) 
es también diferente de cero. Pero de la igualdad (a;—f)a(P¿==0 resulta en- 
tonces P=a, que es lo que se quería demostrar. 
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Si d=a 71 +... +05£P, es una descomposición espectral de una aplica- 
ción A y si (A) =Bo0 BLA +--.EBpA” es un polinomio cualquiera, se flene 


HD=f[(a) P+F Has) Ps. (29) 
Tenemos 


EP. +%,. 
Ama PA ass, 
im Y a Py DAA AA PP ARPA Rs, 


..AÁ.02.o2o02..2P2..b.b.o.. _.. 060)0)).0100sms8 4 . " . e . . . . . s e . . e . 5d . . , 


AC AITOR PYR] =D AUT AUPPA= APA AD 


Multiplicando estas igualdades por los números Bo, Bj. ..., Bin. respectiva- 
seo y sumándolas obtenemos ta relación requerida. 
í 


Ama PARA ¿PO Ps 


es una descomposición espectral de una aplicación A, se tiene 


En efecto, consideremos el polinomio 


pr (A) = (A —0z) ... (A —;.. 1) (A — 2/4 1) ... (A — A 5) 
(%¡—0%1) -.. (A¡—Uj¡- 1) (2/1) -- (2¿—Uyg) * 
De acuerdo con (29) tenemos 


PALA) =P (A) LPI a) PAE PR A) Ps 


Pero p¡(ajy=0 (12) y q (a) =1: por consiguiente. q; (41) = P;. 

La última ad significa que foda aplicación normal de un espacio uni- 
tario admile una descomposición espectral, t sólo una. 

Efectivamente, ya hemos demostrado la existencia de la descomposición y 

r ello sólo se trata de demostrar su unicidad. Los coeficientes %,, ..., As de 
a descomposición espectral son los valores propios de la aplicación yY% y, por 
consiguiente, se determinan univocamente por la aplicación .4. Pero si conoce- 
mos estos coeficientes, conocernos al mismo tiempo los polinomios q, (A) y, pos 
lo tanto, conocemos las aplicaciones proyectivas (P; que es lo que se quería 
demostrar. 

Indiquemos algunas otras propiedades de las descomposiciones espectrales. 
El conjunto de los coeficientes Ay, ..., %¿ de la descomposición espectrai se 
denomina espectro de la misma. Se llama especiro de una aplicación lineal el 
espectro de su descomposición espectral. Hemos demostrado anteriormente que 
el espectro de una aplicación normal coincide con el conjunto de sus valores 

ropios. 
á Para que una aplicación normal sea simétrica, respectivamente antisimélrica 
o unitaria, es necesario y suficiente que su espectro sea real, respectivamente ima- 
ginario puro o formado por números de módulo unidad. 

Sea A=%4 PH PH + 057, la descomposición espectral de la 
aplicación A. Tenemos entonces que 4*=02, 2, +40 PH Fay, es la 
descomposición espectral de Ja aplicación conjugada. Puesto que toda aplicación 
normal admite sólo una descomposición espectral, resulta que la condición 
A:x=4A* equivale a las jgualdades a; 0; (¿w* 1, ..., s), es decir, equivale a 

ue el espectro sea real. Hemos demostrado la primera afirmación. Las otras 
os se demucstran análogamente. 
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Ejemplos y problemas 


j. Descompóngase en parte simétrica y antisimétrica las matrices 


270 010 —1 2-2 
622|, |400l! y 4 —2 —al. 
205 009 4 4 2 


y hállense tas descomposiciones polares de las mismas. 

2. Sea L un espacio euclideo de dos dimensiones y sea 4 una aplicación 
lincal del mismo que tiene dos vectores propios unitarios no ortogonales a, y 
2, correspondientes a Jos valores propios A, y Ay (Uy ye Az). Hállese la descon1- 
posición polar de la aplicación 4, si (a,, 42)==cos p, donde q es un valor dado. 

a Indíquese el enunciado matricial de la aplicación de Cayley (teoremas 
2 y 3). 

4. Demuéstrese que toda matriz ortogonal UY de orden tres, que no contiene 
la unidad entre sus valores propios, es de la forma 


ca MEE E | 
FREE li Bay 2 r a) —apipp—i) 


5. Las matrices cuadradas complejas de orden n forman, respecto a las 
uperaciones de adición y de multiplicación por número, un espacio lineal L de 
dimensión n3, Las matrices E;,, en la i-éslma fila y j+ésima columna de las 
cuales aparece la unidad, mientras gue en las demás pS aparece el cero, 
constituyen una base del espacio £. Hagamos cl espaclo L unitario, aceptando 
que las matrices E;¡, ofrecen una base ortonormal en £, es decir, aceptando que 
el producto escalar de dos matrices A y B se calcula mediante la fórmula 
(A, B)= Y) a;¡Biy, donde a, son los elementos de la matriz A y f¿, son los 
elementos de la matriz B. La multiplicación de todas las matrices de Y por 
una matriz cualquiera X a la derecha ofrece una aplicación lineal. del espacio 2. 
Demuéstrese que: _ 

a) las matrices unitarias tienen en £ la longitud igual a Vr 

b) las multiplicaciones por matrices conjugadas transpuestas X y X” origl- 
nan en € aplicaciones ronjugadas. 

c) la multiplicación de las matrices de f por una matriz unitaria origina 
en L una aplicación unitaria: 

d) la multiplicación por una matriz hermitiana origina en € una aplicación 
simétrica, mientras que la multiplicación por una matriz hermitiana antisimé- 
trica origina una aplicación antisimétrica. 

6. Demuéstrese que la suma de dos aplicaciones proyectlvas “Py y “Py es 


una aplicación proyectiva cuando, y sólo cuando, (PgPg=6. Además, en este 
caso Par Pa Pasa 

7. El producto de dos aplicaciones proyectivas Py y ¿Pp es una aplica- 
clón proyectiva cuando, y sólo cuando, Pa y ¿Pg conmutan. Además, en este 
caso Pa Pe = Panes 

8. Un subespacio Y ustá contenido en otro 'B cuando, y sólo cuando, ¿Py Py= 
=P: 

9. Demuéstrese la ¡órmula P,, =$ — Pa: 

10. Un subespacio Y es invariante respecto a una aplicación arbitraria A 
cuando, y sólo cuando, la correspondiente aplicación proyectiva (Pu Py veri- 
fica la relación PAP =PA. 
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1]. pa las o A y H con las descomposiciones espectrales yf = 
= 2419 a -BxQ4 cormutan, toda aplicación ¿Py es conmutable con 
cua 1 apli cación > 
Si una aplicación normal 4 conmuta con cualquier aplicación linca! Y, 
la aplicación ,4 conmuta también con 3?. 
13. Toda aplicación unitaria Y de un espacio unitario complejo puede ser 


representada en la forma U=e , donde 4 es una aplicación simétrica. Recí- 


procamente, la aplicación ¿As unitaria cualquiera que sea la aplicación si- 
métrica A. 


Capítulo VI Formas bilineales 
y Cuadráticas 


Se supone que todos los espacios que aparecen en este capítulo 
son espacios sobre un cuerpo conmute.ivo (pero no sobre un cuerpo. 
cualquiera). 


$ 21. Formas bilineales 


21.1. Transformación de formas. Un polinomio F (£) en las varia- 


bles E,, ..., E, con coeficientes de un cuerpo conmutativo K se 
Mamma forma de grado p-ésimo sobre K en E,, ..., En, sí todos los 
términos de F son de un mismo grado p respecto al conjunto de 
las variables. Se llaman lineales las formas de primer grado, cua- 
dráticas las de segundo grado, cúbicas las de tercer grado, etc. 

Los problemas principales de la teoría de las formas son el pro- 
blema de) estudio de las leyes de variación de los coeficientes de 
las formas en las transformaciones lineales de las variables y el 
problema de la búsqueda de los tipos elementales a los que pueden 
ser reducidas las formas mediante estas transformaciones. 

A veces, en lugar de una forma se considera un par de formas 
en las mismas variables y se plantea el problema de determinar una 
transformacion de las variables en la que ambas formas tomen la 
forma más sencilla posible. Este es el problema de un par de for- 
mas. Se pueden plantear problemas sobre termas de formas, etc. 

Al final de este capítulo daremos la interpretación geométrica 
del problema de transformación de formas, mientras que primero 
consideraremos el problema desde el punto de vista algebraico y 
daremos su solución para el caso de formas cuadráticas. 


Escribiremos las fórmulas que relacionan las variables E,, ..., $, 
con las variables nuevas Es, ..., E, en la forma 
E=Ex HE A E 22 0) 


de acuerdo con el punto 5.1. 
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Supondremos siempre que la matriz T=||1,,|| es invertible asi 
que las relaciones (1) permiten siempre expresar las variables nue- 
vas en términos de las antiguas. La matriz T se llama matriz de 
transformación de las variables E, en las variables E). 

En general, las formas dadas suelen transformarse paulatinamente: 
primero se introducen unas variables nuevas mediante Jas fórmu- 
las (1), después mediante fórmulas análogas se introducen en lugar 
de Ej unas variables E;, etc. Sea T=T, la matriz de la transfor- 
mación de las variables E en las variables E”, sea T, la matriz de 
la transformación de E' en E”, etc. Introduciendo en las jórmulas (1) 
en lugar de E) sus expresiones en términos de E, expresaremos las 
variables E) linealmente en términos de E. Los cálculos directos 
muestran que la matriz de la transformación de E en E” es T,T, 
(compárese con el p. 5.1). Aplicando este resultado varias veces, 
llegafnos a la conclusión siguiente: si a la transformación de las 
variables E en las variables E' le corresponde la matriz T,, si a la 
transformación de E' en E” le corresponde ta matriz T,, etc., enton- 
ces a la transformación resultante de fas variables E en las variables 
Em te corresponde la matriz igual al producto TaT am, --- Tal, de 
las matrices de las transformaciones intermedias. 

Supongamos, por ejemplo, que debemos reducir a la forma ele- 
mental] lá forma cuadrática 


F = El y $3 — 28,5, — 25,8, + 106152: 


Tenemos 
F = (E, —E, —53)* —63 + 8,57- 


Introduciendo Jas variables nuevas 


E, =E, —E,—É,, Es = En y Es =És, 


obtenemos 
Fl ES — Es + 8ÉLES = Es? — (Es — 455)" + 1687. 
La transformación 
E => E=E—4E y Es =4bs 
reduce la forma F a la forma elemental 
FE =ES —Es' + Es. 


Según la regla expuesta, la matriz de la transformación de £” en 3 es 


100 1 00 | 00 
=1 10 0 10|=| —] A 
—=1 01 O —=4 4 —1 —44 
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Como segundo ejemplo consideremos el problema general de trans- 
formación de un sistema arbitrario de m formas lineales 


f,=E1% 1 E E %1 + ++ FE | 
E E (2) 
Fm = EZ + Er + ... + nta 


en n variables. La matriz A=||a¿;,||, que para m«Asn resulta rec- 
tangular, se llama matriz de este sistema. Introduciendo en las 
formas dadas en lugar de las variables $, sus expresiones en térmi- 
nos de Es definidas por (1), obtenemos un sistema de m formas 
lineales en las variables nuevas Ej. El cálculo directo muestra que 
la matriz A, del sistema nuevo está ligada a la matriz A del si- 
stema antiguo mediante la relación 


A,=TA, 


es decir, al pasar a las variables nuevas la matriz de un sistema de 
formas lineales se multiplica a la izquierda por la matriz de la trans- 
formación. 

Para reducir el sistema (2) a la forma elemental escojamos entre 
las formas f,, ..., fm 51» +», E, las 1 primeras linealmente inde- 
pendientes. Sean éstas las formas fi, ..., fin Elpor +++» Eln» Es 
evidente que el número r es igual al rango de la matriz A. Pode- 
mos introducir en lugar de E,, ..., E, unas variables E; tomando 


E =fe, (5), .... Es == F:, (E), Elo Er 10 ...,3 En =Ela 


y después de ello el sistema dado (2) tomará la forma elemental 


requerida 
En» SN Es, Reis A Ens 


donde fiin, -.-, fi son unas formas lineales en E;, ..., E,. En 
particular, si todas las jormas iniciales eran linealmente Indepen- 
dientes, la transformación de variables señalada las reducirá a la 
forma canónica f.=E,, ..., [n= Em- 


21.2. Equivalencia de formas bilineales. Frecuentemente en lu- 
gar de tos polinomios en un sistema de variables E,, ..., É, se con- 
sideran los polinomios en dos sistemas de variables, por sunlO: 

a <<<» En Y M1» »--. Ty, así como los polinomios en varios sistemas 
de variables. Un polinomio en varios sistemas de variables se llama 
forma si es homogéneo respecto a cada uno de los sistemas de va- 
riables por separado. Son de un interés especial las formas lineales 
respecto a cada uno de los sistemas de variables. Estas formas se 
llaman bilireales, si hay dos sistemas de variables, frilineales, si 
hay tres sistemas, y polineales en el caso general. 

El número de variables de cada uno de los sistemas puede ser 
distinto. El problema de transformación de formas de varios siste- 
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mas de variables puede plantearse en diferentes aspectos, ya que 
se puede someter a una transformación lineal cada uno de Jos siste- 
mas de variables independientemente de las transiormaciones de los 
restantes sistemas y se puede también realizar con cada uno de 
estos sistemas transformaciones que estén ligadas entre si de algún 
modo. 

Se llaman equivalentes las formas que pueden ser reducidas una 
a otra mediante una selección independiente de transformaciones 
lineales de Jas variables. En cambio, se dice que las formas son 
congruentes, si todos los sistemas de variables contienen un mismo 
número de variables y las formas de estos sistemas pueden ser re- 
ducidas una a otra mediante transformaciones lineales—de una misma 
matriz—de cada uno de los sistemas. Está claro que las formas con- 
gruentes son siempre equivalentes. La recíproca, por supuesto, no 
tiene lugar en el caso general. Es fácil dar ejemplos de formas 
equivalentes que no son congruentes limitándose incluso al caso de 
formas bilineales. En este punto consideraremos el problema ele- 
mental de equivalencia de formas bilineales y en el punto siguiente 
examinaremos el problema sobre la congruencia de formas bilineales 
simétricas. 

Una forma bilineal en dos sistemas de variables E,, ..., E, y 
Mi» --..» Nn €s de la forma 


F=Yaj¿m (i, ¡=1, 2, ..., a). 
La matriz A=||«,, |] formada por los coeficientes de la forma se 
llama matriz de la forma y el rango de la matriz Á se llama rango 
de la forma. 
Introduciendo las matrices de una fila 
X=[E8,, ...9 En) e Y =[(n,, ..., Na], 
podemos representar la forma F de modo siguiente 
F=XAY". (3) 


Supongamos ahora que debemos pasar de las variables E y n a 
unas variables nuevas E” y wm” ligadas a las antiguas mediante las 
fórmulas 

Ey= DD) Estay y n¡= Y, 101, 
o empleando la notación matricial 


X=X TT e Y=Y.S, (4 
donde T=||7,,I|, S=||0;, [| y 
X,= (E, ..., En] e Y,=[m, .... ui. 


Introduciendo en (3) las expresiones (4) para X e Y, obtenemos 
F=X, TASY:¡=X A Y;, 

donde A, es la matriz de la forma transformada. 

17—1843 
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Por consiguiente, si en una forma bilineal de matriz A se realiza 
una transformación de matriz 7 del primer sistema de variables y 
una transilormación de matriz S del segundo sistema de variables, 
se obtiene una forma bilineal de matriz 


A, =TAS*. (5) 


Hemos explicado ya que las formas bilineales que se obtienen 
una de otra mediante transformaciones lineales de las variables se 
llaman equivalentes. Por otra parte, según el p.13,4 unas matrices 
A y A, se llaman equivalentes sobre un cuerpo conmutativo K, si 
existen .unas matrices regulares P y Q formadas por elementos de 
K tales que A, =PAQ. Comparando con la fórmula (5), vemos que 
para la equivalencia de unas formas bilineales sobre un cuerpo con- 
mutativo arbitrario K es necesario y suficiente que sus matrices sean 
equivalentes. 

Según el p. 13.4, todas las matrices cuadradas de un orden dado 
n y de un rango dado r son equivalentes entre sí sobre el cuerpo 
conmutativo K y son equivalentes a una matriz de tipo E,+-0,..., 
donde E, es la matriz unidad de orden r y O,., es la matriz nula 
de orden n—+r. Aplicando esto a las formas bilineales obtenemos el 
siguiente resultado que resuelve totalmente el problema de equiva- 
lencia de las formas bilineales: 

Para la equivalencia de unas formas bilineales sobre un cuer po 
conmutativo arbitrario es necesario y suficiente que coincidan los ór- 
denes y los rangos respectivos de las matrices de estas formas. 

Las formas de determinante diferente de cero se llaman regulares 
! las demás se llaman singulares. El resultado obtenido acerca de 
a equivalencia de formas significa que todas las formas bilineales 
regulares en sistemas de n variables son equivalentes a la forma 


EN. + E, Ns + Pa + En Vo» 
nena que todas las formas singulares son equivalentes a formas 
e tipo 
EN, Emi +... +E,n, (r=0, 1, 2, ...y n—1), 
donde r es el rango de la forma. 
Si el campo principal es el cuerpo de los números complejos, 


suelen considerarse, además de las formas bilineales corrientes, /as 
formas de Hermite, es decir, las formas de tipo 


F= 2 Em) 


donde la raya superior significa que se pasa a los valores conjuga- 
dos. La notación matricial de una forma bilineal hermitiana de 
matriz A=||a,,(| es 


F=XAY', 
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y la matriz A, de la forma hermitiana nueva que resulta de F al 
realizar la transformación (4) de las variables es igual a 


A,=TAS'. (6) 
De aquí obtenemos, al igual que antes, que todas las formas 


bilineales hermitianas en sistemas de n variables son equivalentes a la 
forma 


EN + EM +... +E,9,, 
donde r es el rango de la forma dada, 


21.3. Congruencia de formas bilineales simétricas. Hemos seña- 
lado anteriormente que las formas bilineales en dos sistemas com- 
puestos por un mismo número de variables se llaman congruentes 
si se obtienen una de otra mediante transformacionés lineales de 
matrices idénticas de ambos sistemas. 

Tomando S=T en la fórmula (5), Hegamos a la conclusión de 
que al someter ambos sistemas de variables de una forma bilineal de 
matriz A a una transformación lineal de matriz T, la matriz de la 
forma nueva será 

A,=TAT". (7) 


Unas matrices A y A, se llaman congruentes, si están ligadas 
por una relación de tipo (7), donde T es una matriz regular ade- 
cuada. Por consiguiente, las formas bilineales son congruentes si, y 
sólo si, son congruentes sus matrices. 

Una forma bilineal cuya matriz es simétrica o antisimétrica 
también se llama simétrica o antisimétrica, respectivamente. 

Sí una forma bilineal dada es simétrica o antisimétrica, la misma 
propiedad tendrán todas las formas congruentes. 

Efectivamente si A"=w3w A, de (7) resulta 


A¡=3TA4A'T'"=3A,. 
Considerando análogamente las formas bilineales hermitianes, ob- 
tenemos de (6) que la matriz A, de la forma hermitiana nueva que 


resulta al aplicar a la forma de matriz A una transformación lineal 
de matriz 7 de ambos sistemas de variables es igual a 


A,=TAT". (8) 

Unas matrices Á y A, se llaman hermitianas congruentes, si 

están ligadas por la relación (8) mediante una matriz regular T., 

Por lo tanto, la congruencia de las formas hermitianas equivale a 
la congruencia de hermitiana sus matrices. 

Una forma hermitiana se llama simétrica si su matriz es hermi- 

tiana simétrica, es decir, si A*=A. De (8) se desprende directa- 


mente que si una forma hermitiana dada es simétrica, todas las 
formas congruentes de la misma son también simétricas. 


Lo 
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Puesto que Ja congruencia de matrices implica la equivalencia 
de las mismas, para la congruencia de unas formas es necesario que 
coincidan sus rangos. Sin embargo, esta condición no es suficiente. 
Las condiciones suficientes en el caso más general serán examinadas 
en el p. 23.3; ahora daremos estas condiciones para los casos más 
importantes solamente. 

Sea, ante todo, K el cuerpo de los números reales y sea A una 
matriz simétrica. Existe entonces, de acuerdo con el p. 19.4, una 
matriz unitaria real U tal que la matriz A,=UAU”1! tendrá la 
forma diagonal. Pero si U es unitaria, tenemos UU' = E, de donde, 
debido a que las matrices son reales, se deduce que U”*1=U”", es 
decir, A, =UAU”. Por consiguiente, A es congruente de una matriz 
diagonal A,. Luego, hemos demostrado el teorema siguiente: 

TEOREMA 1. Toda forma bilineal simétrica real puede ser reducida, 
mediante una adecuada transformación unitaria real de las variables, 
a la forma 


a.m, + Ese + e. + ab,» (9) 


donde r es el rango de la forma y QU, ..., a, son los números 
característicos diferentes de cero de la matriz de la forma. En par- 
ticular, para la equivalencia unitaria de unas formas bilineales 
simétricas reales es necesario y suficiente que coincidan los polinomios 
característicos de las matrices de las formas. 

Este teorema de más de lo que pretendíamos obtener, Significa 
que la reducción a la forma diagonal se puede alcanzar mediante 
una transformación unitaria real de las variables. Si no es necesario 
que la transformación de las variables sea unitaria, podemos conti- 
nuar la reducción a la forma elemental. Es decir, supongamos que 
hemos reducido ya la forma al tipo diagonal (9). Cambiemos ahora 
la numeración de las variables de manera que primero aparezcan 
los términos de coeficientes positivos y después los de coeficientes 
negativos. Supongamos, por ejemplo, que «,, ..., a, son positivos 
y qUe %,,1, -.., % Son negativos, Tomando entonces 


E=Va E) w“=Vamwy  (I=1,..., s), 
E=VW— 0 Er =V—am  (i=s+l, -.., 1), 
podemos reducir Ja forma dada a la forma 
A a A A (10) 


La diferencia 
0=s—(r—s)=2s—r 


se llama signatura de la forma (10). Es evidente que la forma (10) 
se determina totalmente por su rango y su signatura, ya que 


=>3 (0+1). El hecho de que la signatura no depende de cómo se 
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reduce la forma dada a la forma (¡0) y, por consiguiente, se deter- 
mina univocamente por la jorma inicial, constituye el contenido de 
JS así Arda ley de inercia que será examinada detalladamente en 
el p. 22.3. 

Para las formas simétricas hermitianas la situación es totalmente 
análoga. Sea F una forma hermitiana de matriz hermitiana simé- 
trica A. De acuerdo con el teorema 4a (p.19.4), existe una matriz 
unitaria U tal que la matriz A, =U AU”! será diagonal real. Como 
U es unitaria, tenemos U”7*=U*, de donde A,=UAU". Hemos 
demostrado, pues, el siguiente teorema: 

TEOREMA 2. Toda forma bilineal hermitiana simétrica puede ser 
reducida, mediante una transformación unitaria de las variables, a la 
forma diagonal 


a E,n, +, +...+ a,E,n, 


con coeficientes reales. Los valores a,, ..., a, son las raices diferentes 
de cero del polinomio característico de la matriz de la forma y por 
ello para la congruencia unitaria de las formas hermitianas simétricas 
es necesario y suficiente que coincidan los polinomios característicos 
de estas formas. 

Si en lugar de la congruencia unitaria se considera la congruencia 
respecto a transformaciones lineales arbitrarias, el proceso de reduc- 
ción de una foma puede ser continuado como ha sido señalado 
anteriormente y así obtendremos una forma de tipo 


EM, + e... FE — Es Mo9 1 — a —E,n,- (1 1) 
Toda forma hermitiana simétrica puede ser reducida, por consiguien- 
te, a una de estas 241 formas (r=0, 1, ..., n). Otra vez la 


no congruencia de las formas (11) para diferentes valores de s se 
desprende de la ley de inercia mencionada anteriormente. 


Ejemplos y problemas 


I. Demuéstrese que el sistema de formas lineales en Ex, Er En y Es 


Ent+bs Estás sabs y fa bEs 


es equivalente al sistema 


E-+bts tos EatbEst+Es EE + E. y £i+ 


y no es equivalente el sistema 


EL—lebts Er+bs— E “Bit Es y 2 +3 —Es- 
2. Demuéstrese que un sistema de formas lineales 
f=Emi + Et Ena (b=l, ..., m) (12) 


es equivalente a otro sistema 


titi bon li=1, .-.. m) (13) 
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cuando, y sólo cuando, el sistema de vectores 
a=[81¿ Ugo ...y Enf) (ix 1, ...p m) (13) 
del espacio lineal de dos vectores filas puede ser convertido, mediante una 
adecuada transformación lineal regular de este espacio, en el sistema de vectores 
b¿=(By,, Bar, ...», Bnr] (i=1l, ..., m). (15) 


3. Demuéstrese que el sistema de formas lineales (12) puede ser reducido, 
mediante una transformación unitaria de las variables, en el sistema (13) cuando, 
y sólo cuando, el sistema de vectores (14) del espacio unitario de filas puede 
ser convertido, mediante una adecuada aplicación unitaria de este espacio, en 
ej sistema de vectores (15). 

4. Demuéstrese que para la equivalencia de formes bilineales en sistemas 
que contienen diferente número de variables es necesario y suficiente que coin- 
cldan las dimenslones (es decir, el número de fitas y el número de columnas) 
y los rangos de las matrices de las formas. En particular, las formas bilineales 


en dos sistemas de variables E,, ..., ao n > m) de rango r son 
cquivalentes a la forma Ne a Na Um Á ) E 
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22.1. Congruencia. Según la definición general, una forma cua- 
drática en las variables E,, ..., E, es un polinomio homogéneo de 
segundo grado en estas variables. Toda forma cuadrática en las 


variables indicadas puede ser representada univocamente en la si- 
guiente forma simétrica 


FE)=->ajss, (a;,= y). (1) 


La matriz al a, || se llama matriz de la forma cuadrática *y 
la forma bilineal simétrica 


F E, y => a, £m, 


en dos sistemas de variables, que tiene la misma matriz que'la 
forma cuadrática, se llama forma polar de esta última. ldentificando 
en la forma polar el primero y el segundo sistemas de variables 
obtenemos la forma cuadrática inicial. Así se establece una co- 


rrespondencia biyectiva entre las formas cuadráticas y las formas 
bilineales simétricas. Por ejemplo, si 


F (E) = E —Es + 316, — 6É26s, 


la notación simétrica de F (E) es 
F()=0—8+38%, +55 — E, —3EJE, 
y la forma polar correspondiente es 


F (E, n) = En, pS EsNa an 5 E, + > E, 0 35.1% — 38,N,. 
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Se dice que una forma cuadrática es diagonal si su matriz es 
diagonal, es decir, si la forma contiene sólo términos con los cua- 
drados de las variables. 

Realizando en la forma (1) una transformación lineal de las va- 
rlables de matriz T, obtendremos una forma nueva (p. 21.1) 


F(E)=XAX'=X TAT'X; 
(= [Eno 04. En) y X.=(Ex, E En) ) 


A,=TAT". 


Por consiguiente, la ley de variación de la matriz de una forma 
cuadrática es la misma que para la correspondiente forma bilineal 
polar. De aquí se deduce que unas formas cuadráticas son congruen- 
tes cuando, y sólo cuando, son congruentes las correspondientes 
formas polares y del teorema 1 del parágralo anterior obtenemos 
directamente el teorema siguiente: 

TEOREMA 1. Todo forma cuadrática real puede ser reducida median- 
te una adecuada transformación ortogonal real de las variables, a 
la forma diagonal 


de matriz 


a+ a+... +0, (2) 


donde r es el rango de la forma inicial y Q«,, ..., a, son los niúme- 
ros característicos diferentes de cero de la matriz de la forma. En 
particular, para ta congruencia ortogonal de unas formas cuadráticas 
reales es necesario y suficiente que coincidan los polinomios caracte- 
risticos de las formas. 

Si se aceptan también transformaciones no ortogonales de las 
variables, es posible continuar la reducción: si A,, ..., A, SON po- 
sitivos y %s+,, »- .. %, Son negativos, la forma (2) se reduce median- 
te la sustitución 


E =V a, Es, t¿¡=V—a,E, ((=1, o...) $, =S+l,...,r) (3) 
a la forma > ps 7 
EH. +Es —Esti— +. —ÉEr 

Por consiguiente, a esta forma puede ser reducida, sobre el cuerpo 

de los números reales, cualquier forma cuadrática. El caso de otros 


cuerpos conmutativos será considerado en el punto siguiente. 
Una expresión de tipo 


FE=22EE=XAX" (X=lE, ...,E,)), 
donde L;¡=% 1 (, j=1, ...,1n), se llama forma cuadrática hermi- 
tiana en las variables E,, ...,E, de matriz A=|]a,,]]. La forma 


bilineal simétrica hermitiana F (E, 1 Darin, se llama forma po- 
lar de F (6). Las leyes de variación de las matrices de una forma 
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cuadrática hermitiana y de su forma polar coinciden. Por esto la 
congruencia de las formas cuadráticas hermitianas equivale a la 
congruencia de sus formas polares y del teorema sobre la reducción 
de formas bilineales simétricas hermitianas (p. 21.3) se deduce el 
teorema siguiente: 

TEOREMA 2. Toda forma cuadrática hermitiana puede ser reducida, 
mediante una transformación unitaria de las variables, a la forma 


abro +a (4) 
donde r es el rango y Q;, ..., A, son los números característicos no 
nulos de la matriz de la forma dada. Para la congruencia unitaria 
de unas formas cuadráticas hermitianas es necesario y suficiente que 
coincidan los polinomios caracteristicos de las matrices de las formas. ” 

Mediante una transformación ulterior de Jas variables de tipo (3), 
que ya no será unitaria, la forma (4) puede ser reducida a la forma 


EE, + e + E — Er 418041 — EE —tk, 


que es en este caso la elemental. 


22.2. Algoritmo de Lagrange. Uno de los métodos más simples 
de reducción de una forma cuadrática a la forma diagonal es el 
así llamado método de Lagrange que será considerado aquí. Se puede 


aceptar que el campo principal es un cuerpo conmutativo cualquiera 
de característica diferente de 2. 


Supongamos que la forma (1) debe ser reducida a la forma dia- 
gonal. Pueden darse dos casos: a) la forma contiene el cuadrado 


de al menos una variable y b) la forma no contiene los cuadrados 
de las variables. 


a) Supongamos, por ejemplo, que a,, 75 0. Representando la forma 
del modo siguiente 


F=a +20 E + --- +20,E18, + 0 > ¡E E 


= 0 (181 + Lib + >> +26) —a11 (a+ 20% EE, +... 
. +» +0 lbn) iS A ¡ns = (%,1É, +91 +-.- 


is +01 HF (E, Bos En), 


donde F, es una forma cuadrática en E,,...,E,, y realizando la 
sustitución 


E =0%,É5, +12 E bn 
E=E (i=2, 3, ..., a), 
podemos reducir F a la forma 
F=sarti +4,» 
donde F, no depende de E),. 
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b) Supongamos que =...=0,,=0 y que, por ejemplo, 
%1, 70. Representando la forma F del modo siguiente 

F=2E, (Att... + 1nEn) + E, (E 2. En) 
y realizando la transformación 
Er = Oah + e. “E Onin —É, 
E, =€, (i=1, 3, 4, ... » n), 
obtenemos ta forma 
F=2E(E5+E)+F,=2 +25 +20 0,554... 
que contiene el cuadrado de la variable E),. 

Por consiguiente, aplicando el proceso a) y complementándolo, 
en los casos necesarios, con el proceso b) podemos reducir la forma 
dada a la forma diagonal. 

Ejemplo. Es necesario reducir a la forma diagonal la forma 

F =El + 451 +83 —ES— 4rba + 6515) — 12:83 + 2354 + Ex Es — Esta - 

Tenemos 

F=(E,—2L:+3Es)? —E —E4 + Esto + Ens —E sin 
Realizando la transformación 


61 =E,—2, +33, U=E (i>1, 
obtenemos la forma 


Pr E E as Es E — (Es Es) + habi Es Es 
que mediante la transformación 


melts w="bk (143) 
se reduce a la forma 


F, =9 — 13 + NM —NeNo- 
Ahora, de acuerdo con b), realizamos la transformación 
MMMM Wen (44), 
obteniendo así la forma 
.3 el , . , .»3 ,3 , 1 ¿2 1 . 
Fy == —M3 +(n+ 11.) n= -—Ts +(m+>3m) 30 . 
Esta forma mediante la transformación 
, ] , , PA , 

La=9% +3 Mo E=wy ((=1,3, 4), [¿=0x2 

se reduce a la forma diagonal 


i 
Fao=+ 05 qe 
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Para hallar la matriz 7 de la transformación de las variables f; en las va- 
rlables iniciales E, es suficiente, por lo visto en el p. 21.], multiplicar las ma- 
trices de las transformaciones intermedias. 


V 

Si en vez de una forma cudrática es necesario reducir a la forma 
diagonal una forma bilineal simétrica, sustituimos la forma bilineal 
por la cuadrática correspondiente, reducimos esta última a la forma 
diagonal y determinamos la matriz de la transformación. Debido a 
la relación que existe entre las formas cuadráticas y bilineales, esta 
transformación también reducirá a la forma diagonal la forma bili- 
neal dada. 

Para concluir, consideremos el problema sobre la reducción a la 
forma elemental de una forma bilineal antlsimétrica 


F=Ya km, (a =— 0) 


cuyos coeficientes pertenecen a un cuerpo conmutativo cualquiera. 

Si todos los coeficientes son iguales a cero, la forma está ya 
reducida. En el caso contrario aceptaremos, por ejemplo, que a, >£ 0. 
Escribiendo la forma det modo siguiente . . 


F=E, (01014... +%590)—W% (2:51 +. ++ inEn) + 
(Ea. ....,y Sui Ye» y... 99 N,) 


y realizando la sustitución 


Ly = Ox16s Po... + Arnbnr Mi = LN + > - + Aro 
E, == Ey, Ww=WN: (=1, 3, pas 1), 
obtenemos la forma 


P, =Em— EM +R1 (Es, >.., En Mir «> -» Mn). 


Ahora pueden darse dos casos: a) el resto R, no contiene E; y, por 
consiguiente, tampoco contiene n, y b) el resto contiene Ez. En el 
caso a) aplicamos el proceso solamente al resto, ya que éste no de- 
pende del término que hemos despejado E,m,—Ezn. En el caso 
b) representamos la forma del modo siguiente 


F,= EM — Es + Esla >> + Ln) — 
— Me (tes +... + nba) + Ra En. -.)= 
= (E, — Usb — « - - —Oanbn) Ma — 
— (M) — ga — + + - — Na) Es + Ra (Es. ---) 
y realizamos la sustitución 
Es = E — Op E— + + — OgnEn» 
Mi = 1 — AM + ++ — Cao 
E=ÉE  w=nw (=2,...,1), 
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obteniendo como resultado la forma descompuesta 
E — EM) + Ra (Es, ---, Ms --.). 


Aplicando el proceso expuesto al resto, después al resto nuevo, etc., 
reduciremos la forma a 


E — 52M + EM EN + H + Sar 1 Mer — EarVar 17 


donde 2r es el rango de la forma reducida y, por consiguiente, 
también de la inicial. En particular, obtenemos de nuevo que el 
rango de una matriz antisimétrica es siempre un número par. 


Ejemplo. Redúzcase a la forma elemental la forma 


F=Em2— Es + Ea — 521 — 2814 + 2541 +3 522 — 3532 + 
+ as —Esta— ¿ana + Eaa> 


De acuerdo con la regla, realizamos la primera transformación 


E: =8+E,—2E4 18M Fns—2Na 
E=ti, w=8"w (=1, 3, 4), 
después de la cual la forma se convierte en 
Ey =Exm9 —Esn1 + Somo —Msma + Es me — Eso — ona + Ens 
Realizando ahora la transformación 


Es = Es —SEs — Ear Mi == —32—Neo 
E=E, wen  ((=2, 3, 4), 
obtenemos la forma elemental! 
Fa = Em: — Em — 48394 + Mans 

Desde el punto de vista práctico el problema sobre la reducción 
de las formas cuadráticas a la forma elemental se descompone en 
dos momentos: la determinación de la forma elemental definitiva 
Y la determinación de. la matriz de la transformación de las varia- 

les necesaria para reducir la forma a la forma elemental. Si la 
reducción se realiza mediante transformaciones lineales arbitrarias, 
ambos problemas quedan resueltos al aplicar el algoritmo de 
Lagrange. 

La situación es más compleja si las formas se reducen mediante 
transformaciones unitarias de las variables. Sea dada una forma 
hermitiana de matriz A. En el espacio unitario auxiliar de vectores 
filas la multiplicación de las filas por la matriz A representa una 
aplicación lineal simétrica 44 de matriz A en la base elemental 
(p. 4.1). Debemos determinar una base ortonormat en la que la 
matriz Á de la aplicación sea de forma diagonal. Para ello halla- 
mos los números característicos «,, ..., a, de la matriz A que se 
obtienen resolviendo la ecuación característica de A. Después, 
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resolviendo el sistema de ecuaciones lineales 
[S,. ..., En) Á=0; (E, ...» En] 


respecto a las incógnitas É,, ..., E,, encontramos n vectores pro- 
pios linealmente independientes 


x= (Ey, ...,) E] (i=l, ..., n) 


de la aplicación 4. Normalizando estos vectores, obtenemos una 
base ortonormal en la que la matriz A y, por consiguiente, la 
forma hermitiana inicial adquieren la forma diagonal con los ele- 
mentos diagonales «,, ..., %,. Si los vectores x, son ya normali- 
zados, la matriz requerida de la transformación será 7 =||E5? |]. 


22.3. Ley de inercia de formas cuadráticas. En los resultados 


del p. 22.1. acerca de la reducción de formas cuadráticas reales, 
así como de formas hermitianas complejas, a la forma diagonal 
hemos dejado una laguna: no hemos aclarado si pueden ser congruen- 
tes formas de diferente signatura. El teorema que sigue llena esta 
laguna. y 

TEOREMA 3 (ley de inercia). Toda forma cuadrática real puede ser 
reducida a la forma diagonal a Et+... +0, mediante un número 
infinito de transformaciones de las variables. Sin embargo, aun cuando 
los propios coeficientes a,, ..., a, pueden depender de la transfor- 
mación que se emplee, el número de los coeficientes positivos y el 
número de los coeficientes negativos que aquí figuran no dependen 
de las transformaciones señaladas y, por consiguiente, se determinan 
untuocamente por la propia forma inicial. 

Supongamos, al contrario, que una forma cuadrática real 


al + o. ASE — sy 1 Bd 1 — sa — a (a; > 0) 


se convierte, mediante la transformación de las variables E, = Y Estas, 
de nuevo en la forma diagonal 


BES BES —Brtin—-—B E? (B,>0), 
pero siendo s< t. Esto significa que la igualdad 
afi+ co. + 57 — ga is — E — a, = 
=BE + ... + BES —Brerbrar — ...o” BA 


se convierte en una identidad al sustituir las variables E, por sus 
expresiones en términos de las variables E/. Representemos esta 
identidad en la forma , 

Abi > ; + bi Brenes +... +B,= 

=PE +-.. +BE +A. + 055 (5) 


y consideremos el sistema de ecuaciones 
E,=0, E E, 0, Er, 1 =0, e... En=0, (6) 
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donde por E,, ..., E, se comprenden sus expresiones en términos 
de Ei Les Es: El sistema (6) es un sistema de ecuaciones lineales 
homogéneas respecto a las incógnitas E,, ..., €,, siendo el número 
de ecuaciones s+ (1 —(f) =n-—(1—s) indudablemente menor que el 
número de incógnitas, ya que ¿'>s, Pero en estas condiciones el 
sistema (6) debe tener al menos una solución no nula 


EL Yao + EL Yer Es =0, +. ., En =0. (7) 
Introduciéndola en la identidad (5), obtenemos 

Brit EP 0 E7=0. (8) 
Los números f, y «a, son positivos y los números y? y E? son no 
negativos y por ello de (8) resulta que y,=... =y,=0 lo que 


contradice a que la solución (7) es no trivial. 

La ley de inercia tiene lugar también, con el mismo enunciado, 
en el caso de formas cuadráticas hermitianas. La demostración no 
difiere de la que acabamos de realizar. 


22.4. Formas de signo constante. Una forma cuadrática real 
F (6) = 2 fi) se llama no negativa si su valor es no negativo 
cualesquiera que sean los valores reales de las variables E. La forma 
se llama definida positiva si su valor es estrictamente positivo para 
cualquier sistema no nulo de valores de las variables. Análogamente 
se introducen los conceptos de formas no positivas y de formas 
definidas negativas. Las formas no negativas y mo positivas se lla- 
man a veces formas de signo constante. 

Si una forma en n variables E,, ..., E, es de forma diagonal 


agi+ ... + a ti— 0 4 bi — e... — ak; (%; > 0), 


es fácil ver que será definida positiva cuando s==n, no negativa 
cuando s=r<Ánm, no positiva cuando s=0 y definida negativa 
cuando s=0 y r=n. Siendo 0 <s<r la forma puede tomar va- 
lores positivos para unos valores de las variables y valores negati- 
vos para otros valores de las variables. Puesto que la constancia 
de signo de una forma se conserva al realizar una transformación 
de las variables, se puede decir que son definidas positivas aquellas 
formas que se reducen a la suma de n cuadrados positivos y que 
son mo negativas aquellas formas que se reducen a ta suma de 
cuadrados positivos solamente, aunque sea en un número menor 
que el número de las variables; afirmaciones correspondientes tienen 
lugar para las formas no positivas y definidas negativas. En parti- 
cular, una forma no negativa es definida positiva sólo cuando es 
regular. e 

Si en las formas cuadráticas corrientes se permite que las va- 
riables tomen valores tanto reales como complejos, los conceptos 
introducidos pierden el sentido, ya que en este caso cualquier forma 
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no nula puede tomar valores no reales. La situación es distinta si 
se consideran formas hermitianas. La razón de esto estriba en que 
tanto para los valores reales como complejos de las variables las 
formas hermitianas toman siempre valores reales. Efectivamente, de 


las condiciones a,¿=« , se deduce que 


P= >a, EE Ha E = ay kb EF, 
es decir, se deduce que F es real. Por esto, los conceptos de forma 
no negativa, definida positiva, etc. se pueden extender directamente 
al caso de formas cuadráticas hermitianas. 

Es fácil establecer si una forma es definida positiva, así como 
determinar su signatura, reduciéndola a la forma diagonal por el 
método de Lagrange. Sin embargo, en determinados casos tienen 
gran interés los criterios directos de definición positiva. Entre estos 
nos limitaremos a exponer el así liamado criterio de Jacobi. 

CRITERIO DE JACOB! Una forma cuadrática o cuadrática hermitiana 
en n variables de matriz A es no negativa cuando, y sólo cuando, 
los coeficientes del polinomio característico de A son de signos alter- 
nados. Además, si uno de estos coeficientes se anula, también resul- 
tan nulos todos los coeficientes de los términos de grado interior. 

Efectivamente, por lo visto en el p. 22.1, la forma dada puede 
ser reducida, mediante una transformación de las variables de matriz 
unitaria U, a la forma diagonal de matriz diagonal real A, =UAU'= 
=UAU-1, Puesto que la matriz A, además de ser congruente, es 
también semejante de A,, el polinomio caracteristico de A coincide 
con el polinomio característico de A, y basta demostrar el criterio 
sólo en el caso de formas diagonales de tipo a, EE +... +0,5,5,. 
El polinomio característico de esta última matriz es 

P(A)= (A— a) (AU). . (AT, A777 =P 0 A M1 094773Z 
Si todos los «, son positivos, las fórmulas de Vieta 

09%, Un, -% y (1<R<...<nj) 

muestran que los coeficientes de Pq) poseen la propiedad requerida. 
Recíiprocamente, supongamos que tos coeficientes de un polinomio 
son diferentes de cero y tienen signos alternados y supongamos que 
las raices del polinomio son reales. Debemos demostrar que todas 
sus raíces son positivas, Supongamos, por inducción, que esto ha 
ado ya demostrado para todos los polinomios de grado inferior. 

ntonces q'(A) tendrá n—1l raíces positivas (ya que si todas las 
condiciones indicadas se cumplen para (A), lamBién se cumplen 
indudablemente para q"(A)). Pero en este caso p(2. tiene, según el 
teorema de Rolle,“no menos de 1—1 raíces posit vas y la última 
raíz n-ésima de q(A) será positiva debido a que el producto de 
todas las raíces de p (A) es, por hipótesis, positivo 
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Ejemplos y problemas 


Hállese la matriz de la transformación lineal de las variables que reduce 

ta fora bilineal 
51 — En Esa — Laa + 25401 — 281 
a la a elemental. 

Demuéstrese que sobre un espasio unitario real toda forma bilineal anti- 
simétrica real en n variables puede ser reducida, mediante una transformación 
unitaria real de las variables, a 

2 Em—bm)0 +... +0, (E2r -1Nar En 9371) 


(compárese con el p. 19.5). 
3, Hállense las matrices de Jas transformaciones ortogonales reales de las 
variables que reducen a la forma diagonal las formas 


a) El +E181 + ES: 
b) 9957 — 12ExE, + 485,Es + 13082 —60EzEs + 7183; 
c) 1051/71 + 4192 + 4529 + 121 + 125391 — 2822 — 148395 — 145592 + Ear» 


y ne estas formas elementales. 
. Hállese la matriz de la transiormación unitaria que reduce la forma 


6, %a — 6E2N1 + 2194 — Eat: + 2522 — 281 — GEgn + Gba 


a la forma elemental. 
5. Hállese la transformación de las variables que reduce la forma 


Er tirón 1 + Hb Esos + (s=[5)) 


a la suma de cuadrados. 
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23,1. Equivalencia de pares de formas. En los puntos anteriores 
hemos examinado el problema sobre la reducción a la forma ele- 
mental de una forma cuadrática. En este parrágralo será considerado 
el problema importante acerca de la reducción simultánea de dos 
formas cuadráticas. 

Recordemos que una sucesión de formas bilineales F,, ..., F, 
en los mismos sistemas de variables ÉE,, ..., E, y M1» +--» Na Se 
llama equivalente a una sucesión de formas bilineales G,, ..., 
en las variables Es, ..., Eh y MM, +... ni, si mediante unas trans" 
formaciones lineates invertibles de las variables 


(E]=[8]7P, [(n]=[n"IS (18]=[E,, ..., 6n)) 


las formas de la primera sucesión pueden ser reducidas a las formas 
correspondientes de la segunda sucesión. 

De los resultados del p. 21. a se deduce que una sucesión de 
formas bilineales de matrices , A¿ es equivalente a una 
sucesión de formas bilineales EE matrices Bi» »»«» B, cuando, 
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y sólo cuando, existen unas matrices regulares P y Q con elementos 
del campo principal tales que 
PAQ=B, (li=1l, .. , k). (1) 

Dos sucesiones de matrices A,, ..., A, y B,, , B, se llaman 
equivalentes si están ligadas por las e (D, “donde P yQ 
son unas matrices regulares. Por consiguiente, la equivalencia de 
unas sucesiones de formas y la equivalencia de las sucesiones de 
sus matrices son conceptos que tienen el mismo sentido. 

Sea 4 una variable independiente y sea F y G un par de mat- 
rices cuadradas de un mismo orden n. Los factores invariantes de 
la A-matriz AF—G (véase el p. 13.2) se llaman factores invariantes 
del par F y G. Si el par F y G es equivalente al par F, y G,, 


de (1) resulta 
AF,—G, =U AF—G)yV". 


Por lo visto en el p. 13.3 Sto significa que los factores invarian- 
tes de las A-matrices AF,—G, y AF—G coinciden. Es decir, para 
la equivalencia de dos. pares de matrices es necesarío que coincidan 
los factores invariantes de estos pares. En el caso general esta con- 
dición no es suficiente *. Sin embargo, si las primeras matrices de 
ambos pares son regulares, la coincidencia de los factores invarian- 
tes es suficiente para que estos pares sean equivalentes. 

TEOREMA 1. Sean dados dos pares de matrices cuadradas F, G y 
F,, G, de un mismo orden y sean F y F, regulares. Para la equiva- 
lencia de los pares F, G y F,, G, es necesario y suficiente que los 
factores invariantes de la matriz AF G coincidan con los factores 
invariantes de la matriz AF,—G,. 

La necesidad ha sido ya demostrada y, por ello, estableceremos 
solamente la suficiencia. Supongamos que los factores invariantes 
de las matrices AF—G y AF,—G, coinciden. De las relaciones 


F-AAF—G6)=1E—F-'G, 

e O iba 
se desprende que también coinciden dos factores invariantes de las 
matrices AE—F-1G y AE —F¡'G,. Puesto que éstas son las matri- 
ces características de F-1G y E; IG,, de aquí se deduce (p. 15.3) 
que F-1G y F¡!G, son semejantes, es decir, que existe una matriz 
regular 7 que "satisface la relación 

FPG, =T“UF-=GT. 
Tenemos ahora 
AE —=F73G,= TA AE=F=G)T =TAF-A(F—G)T, 
AF, —G, =P TU IFA(PF=G)T, 


1) En el caso general, además de los factores invariantes, es preciso consi- 
derar también los así [lamados indices minimales. 
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de donde 

F,=UFV” y G,=UGV', 
donde U =F,T"*F-* y V=T". Por consiguiente, los pares F, G y 
F,, G, son equivalentes. 


23.2. Congruencia de pares de formas. Una sucesión de formas 
bilineales en las variables E,, ..., Ea y M +... NM. de matrices 
Aj, ..., Az se llama congruente de una sucesión de formas bilinea- 
les de matrices B,, ..., B, si mediante una misma transformación 
de ambos sistemas de variables las formas de la primera sucesión 
pueden ser reducidas a las formas correspondientes de la segunda 
sucesión. 

Indicando por 7 la matriz de la transiormación de las variab- 


les, tendremos 
Bj¡=TAjT"' (¡=1,2, ..., X). (2) 


Dos sucesiones A;, ..., As Y B,, -.., Ba de matrices arbitrarias 
se llaman congruentes si existe una matriz regular 7 que cumple 
las condiciones (2). 

Análogamente se dice que una sucesión de formas cuadráticas 
o de formas cuadráticas hermitianas es congruente de otra sucesión 
de jormas, si mediante una transformación adecuada invertible de 
las variables las formas de la primera sucesión pueden ser reduci- 
das simultáneamente a las formas correspondientes de la segunda 
sucesión. 

Es obvio que la condición (2) es necesaria y suficiente para la 
congruencia de las formas cuadráticas de matrices A,, ..., A, y 

1” --»«, B,. Para las formas hermitianas esta condición debe ser 
sustituida por la siguiente 
Bj=TAJT" (i=1, 2, ..., K). 


El problema general que hemos planteado acerca de la congruen- 
cia de sucesiones de formas bilineales es muy complejo ya para un 
par de formas. En la segunda mitad del siglo pasado Weierstrass 
obtuvo las condiciones necesarias y suficientes de congruencia en el 
caso en que ambas formas del par son simétricas y, en particular, 
si las formas som cuadráticas y una forma del par es regular. 
Estas condiciones serán expuestas al concluir este punto, El caso 
general de congruencia de pares de formas cuadráticas fue exami- 
nado por Kronecker. Debido a que las condiciones de Kronecker 
son un tanto voluminosas, suelen exponerse en tratados más espe- 
ciales. Tanto las primeras condiciones como las segundas se refieren 
a formas sobre el cuerpo de los números complejos. El caso de 
cuerpos conmutativos de otros tipos fue analizado por Dixon y 
otros autores. 

Consideraremos primero el caso más importante de un par de 
formas cuadráticas reales cuando una de ellas es definida positiva. 


18—1843 
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TEOREMA 2. Fodo par de formas cuadráticas reales en n variables 
tal que una de ellas es definida positiva puede ser reducido, mediante 
una adecuada transformación real de las variables, al par de formas 


de tipo 
A A (3) 


Los números Q,, ..., Qt, Se determinan univocamente, salvo el orden 
en que siguen, por las formas iniciales y no dependen del método de 
reducción. 

En efecto, sean E y G (8) las formas cuadráticas dadas. Puesto 
que la primera es definida positiva, es posible reducirla, mediante 
una adecuada transformación lineal de tas variables, a la suma de 
los cuadrados de las variables. Así obtenemos el par de formas de 


tipo 
+ E+...+8 y Daz, 


Ahora buscamos una transformación de las variables de matriz 
ortogonal real U que reduzca a la forma diagonal la segunda forma. 
Como en este caso la matriz de la primera forma en las variables 
nuevas será igual a 


UEU'=UU'=E, 


es decir, la primera forma conserva su forma unitaria, resulta que 
después de la transformación señalada las formas dadas serán del 
tipo requerido (3). 

Supongamos, finalmente, que mediante una transformación de 
las variables las formas F y (G se reducen al tipo (3) y mediante 
otra transformación se reducen a 


E+E+S+ FE y BEI+ PB E+... +8B,82. (4) 


Existe entonces una transformación de las variables de matriz T 
que reduce el par (3) en el par de formas (4) y, por consiguiente, 
las matrices de estas formas estarán ligadas por las relaciones 


E=TET'" y B=xTAT', (5) 
donde A €es la matriz diagonal de elementos «,, ..., %, y B es 
ta matriz diagonal de elementos f,, ..., PB, a lo largo de la dia- 


gonal principal. De la primera de las relaciones (5) resulta TT'= E, 
de donde B=TAT”!, es decir, las matrices A y B son semejantes 
y los números característicos «,, ..., a, de la primera deben 
coincidir con los números característicos f,, ..., f, de la segunda. 

Para las formas cuadráticas hermitianas tiene lugar un teorema 
totalmente análogo. 

TEOREMA 2. 20do par de formas cuadráticas hermitianas tal que 
la primera es definida positiva se puede reducir, mediante una ade- 
cuada transformación lineal compleja de las variables, en el par de 
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formas de tipo 


EEE +Ebn y afeitar. +abnen, 


donde los números %,, ..., %, se determinan univocamente por las 
formas iniciales y no dependen del método de reducción. 

La demostración es análoga a la anterior. 

Pasando a considerar el caso general observemos, ante todo, 
que la congruencia de un par de matrices implica indudablemente 
la equivalencia de las mismas. Inesperadamente resulta que bajo 
ciertas condiciones es válida también la afirmación recíproca. 

TEOREMA 3. Supongamos que en dos pares de matrices cuadradas 
E, G y F,, G, las primeras matrices F y F, son ambas o bien si» 
métricas o bien antisimétricas y que las segundas matrices G y G, 
son ambas también o bien simétricas o bien antisimétricas. Entonces, 
sobre el cuerpo de los ntúimeros complejos, de la equivalencia de los 
pares señalados se deduce la congruencia de los mismos. 

Existen, por hipótesis, unas matrices regulares U y V tales que 


F,=UFV y G,=UGV”, (6) 

Pasando. a las matrices tramspuestas, obtenemos de aquí que 

F¡=VF'U" y G,=VG'U”, Puesto que las matrices F y F, son si- 
métricas o antisimétricas de aquí resulta 

F,=VFU”,; (7) 


una igualdad análoga tenemos para G,. Comparando (7) y (6) 
encontramos 


UFV' =VFU" y VUU.F=F (V"*Uy. (8) 
Tomemos V-*U=T. La segunda de las igualdades (8) da 
TE=PFT', 
TIF=PFT”, 
. TIFF =FT", 
de donde 
a, Ea T+...+a7T*)F=F(a—E+raT'+...+0.7T'*), 
donde Q,, %;, -.., %,. Son unos números arbitrarios. En el capítulo 
IV (p. 16.3) hemos demostrado que los números % ..., %z Se 


pueden escoger de manera que el polinomio 
p(T)=0oE+a,T +... +0a.T” 


sea raíz cuadrada de 7T, es decir, que q(7)9(7)=7. Tomemos 
P=VQ(T), entonces 


PEP" =VG(T) FQ1(T") Y =VQ(T) 9 (T) FV! =VTFV'=UFV', 
18 * 
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es decir, 

PFP'=F.,. 
Repitiendo estos mismos razonamientos para la matriz G, encon- 
tramos 

PGP' «3 G,. 


Por consiguiente, los pares F, G y F,, G, son congruentes que es 
lo que se quería demostrar. 

Los teoremas 1 y 3 permiten enunciar la siguiente condición de 
congruencia de un par de matrices: 

Sean dados dos pares de matrices F, G y F,, G,. Si F y FÉ, 
son regulares y son ambas o bien simétricas o bien antisimétricas y 
si G y G, también son ambas o bien simétricas o bien antisimétricas, 
la condición necesaria y suficiente de congruencia de los pares F, G 
y F,, G, sobre el cuerpo de los números complejos es la coincidencia 
de los factores invariantes de las matrices AF=G y AF,—-G,. 

Efectivamente, si los factores invariantes de las matrices AF —6G 
y AF,—G, coinciden, los pares F, G y F,, G, son equivalentes en 
virtud del teorema 1. Pero estos pares serán entonces, debido al 
teorema 3, también congruentes. Reciprocamente, si F, G y F,, 
G, son congruentes, son desde luego equivalentes y, por consiguien- 
te, los factores invariantes de la matriz AF—G coinciden con los 
factores invariantes de la matriz AF,—G,. 

Las aplicaciones del teorema 3 a la determinación directa de 
las formas elementales de pares de formas complejas serán conside- 
radas más tarde, en el cap. VII, Aplicando este teorema obten- 
dremos en el punto siguiente la solución del problema de congruen- 
cia de las formas bilinmeales no simétricas. 

Observemos también que si hasta el teorema 3 las formas cua- 
dráticas reales y las formas hermitianas se comportaban igualmente, 
el teorema 3 deja ya de ser válido para las formas hermitianas. 
El ejemplo correspondiente será expuesto al principio del $ 28. 


23.3. Congruencia de formas bilineales no simétricas. Como ya 
hemos señalado anteriormente, los resultados del punto precedente 
permiten enunciar las condiciones necesarias y suficientes para la 
congruencia de cualesquiera formas bilineales complejas regulares 
complementando con ello esencialmente los resultados del p. 21.3. 

TEOREMA 4. Para que unas formas bilineales complejas regulares 
de matrices G y G, sean congruentes es necesario“ y suficiente que 
del los divisores elementales de las A-matrices AG=G" y 

1 "if. 

DEMOSTRACIÓN. Supongamos que las formas son congruentes. Las 
matrices G y G, están ligadas entonces por las relaciones 


G, =UGU". 
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De aquí 
G;¡=UG'U". 

Por consiguiente, el par de matrices G, G' es ccngruente del par 
de matrices G,, G, y los divisores elementales de la matriz 1G—G' 
coinciden con los divisores elementales de la matriz 1G,—G,. 

Supongamos, recíprocamente, que los divisores elementales de 
las matrices AG=G" y 4G,—G; coinciden. Entances el par G, G' 
es equivalente al par G,, G,, en virtud del teorema 1, por lo tanto 


G,=UGV y G;¡=UG'V'. (9) 
Tomemos 
G4G"=S, G—G=T, G,+6,=S, y G6,—6G;¡=7T.. 
De (9) resulta que 
S,=USV' y T,=UTV" 
es decir, el par S, 7 es equivalente al par S,, T,. Puesto que las 
matrices S y S, son simétricas y las matrices T y 7, son antisi. 


métricas, los pares S, T y S,, T, son, en virtud del teorema 3, 
congruentes, es decir, 


S,=PSP" y T,=PTP'", (10) 
Pero == y q = 3% y, por esto, de (10) se desprende que 
G, =PGP*. 


Por consiguiente, Jas matrices G y G, son congruentes. 

El teorema 4 muestra que las formas bilineales regulares sobre 
el cuerpo de Jos números complejos se determinan, salvo un iso- 
morfismo, por los divisores elementales de la matriz 1G—G'. Lue- 
go, para resolver el problema de la clasificación de estas formas es 
suficiente indicar los sistemas de expresiones de tipo (A—a)” que 

ueden servir como divisores elementales de las matrices de tipo 
hG—G". Es fácil ver que estos sistemas no pueden ser arbitrarios. 
En efecto, supongamos que (A—«a)” figura k veces en el sistema 
de divisores elementales de una matriz AG—G'. Entonces (1— a)” 
figurará también k veces en el sistema de divisores elementales de 
la matriz transpuesta 1G”*—G. Pero la matriz 1G'—G es equiva- 
tente a la matriz G'"1(AG'—G)=AE—G'""G; por consiguiente, 
(A—a)” figura k veces en el sistema de divisores elementales de 
la matriz AE—G'”*G, El teorema sobre los divisores elementales de 
una función (p. 16.4) afirma que todo divisor elemental (1—a)” 
de la matriz AE—G'"1G se transforma en el divisor elemental 
(A —a”1)? de la matriz AE—(G'-1G)"1, Puesto que la última ma- 
triz es equivalente a AG—-G', la expresión (A —a”*)” figura A veces 
en el sistema de divisores elementales de la matriz AG—-G”, Por 
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consiguiente, si (A—a)” es un divisor elemental de mutiplicidad k 
de la matriz AG—G', resulta que (A—071)” también será un divi- 
sor elemental de multiplicidad k de ta misma. Siendo a == +1, esta 
condición es trivial. Con razonamientos adicionales «e puede de- 
mostrar que las matrices AG—G” contienen todo divisor de tipo 
(A + 1)2+1 necesariamente un número par de veces, mientras que 
los divisores elementales de tipo (A— 1)9*+* y (A + 1)?” puden fi- 
gurar en estas matrices en combinaciones arbitrarias. Las condi- 
ciones expuestas, para «a, fanto iguales como diferentes de El, 
además de ser necesarias, son también suficientes para que un 
sistema de expresiones de tipo (A—«u)” sea el sistema de divisores 
elementales de una matriz 1G —G”. 


Ejemplos y problemas 
Il. Redúzcanse a la forma elemental, mediante una transformación real de 
las variables, los pares de formas 
a) 2+2xy+2y8 y 2xi—xy: 
b) 2x1 4-2xy + 2x2 + 2424 2y2+ 22? y — 9x?2+36xy+ 18x24 15y24 18y2+182*. 
2. Todo par compuesto por formas bilineales reales, una de las cuales es 
simétrica definida positiva y la otra es anmlisimétrica, puede ser reducido, me- 
diante una transformación real de las variables, a Ja forma 
Em + Em + + En Y % (Ema— End Ar + + Lo (Eos 102r —Err 27 1): 


3. Demuéstrese que el par de formas de matrices 


—2 —6 —6 6 
A 
es equivalente al par de formas de matrices 
2 —3 —J0 $ 
—2 3)Y 2 =1]: 
Para la demostración generalícese el teorema 1 del p. 23.1 al caso de pares 
A, B tales que |A4+p8B] > 0, considerando para ello los factores invariantes 


que son polinomios homogéneos en A y H. 
4. Demuéstrense las últimas afirmaciones del p. 23.3. 


$ 24. Funciones bilineales 


La teoría de formas bilineales puede ser interpretada geométri- 
camente como la teoría de funciones bilineales en espacios lineales. 
Esta interpretación permite al mismo tiempo comprender con más 
profundidad los resultados principales de la teoría de formas; el 
parágralo presente está dedicado a la exposición de la misma. 


24.1. Definiciones principales. Se dice que sobre un espacio 
lineal Y se ha definido una función p(x, y) de dos vectores va- 


riables x e y, si a todo par de vectores del espacio € se pone en 
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correspondencia un determinado elemento q (x, y) del campo prin- 
cipal K del espacio considerado. La función q (x, y) se llama bili- 
neal si es lineal respecto a cada una de Jas variables por separado, 
es decir, si satisface las identidades 


P(2X, + LXa, Y)= AP (Xi YY HO (Ls, Y), (1) 
P(%, BY +Bga) =BLP(X) Y) AEB (A Ya). (2) 


Una función bilineal sobre un espacio complejo lineal se llama 
bilineal hermitiana, si es lineal respecto a la primera variable y 
antilineal respecto a la segunda, es decir, si satisface la relación 
(1) y la relación 


ex By +BL)=BO( Y) FB O Ya). (3) 


De (1), (2) y (3) se deduce directamente la regla general distri- 
butiva 


PATH A A YA Hs) = DRA Y) (4) 


que es válida tanto para las formas bilineales como para las bili- 
neales hermitianas. 
Tomemos en %* una base arbitraria a,, ..., a, y sea 


x=E,0, +EJ0)+ >. +Ep20s 
y =0,4, + 9.4, + td 
De las fórmulas (2) y (4) resulta 


px, y=X (a, aim = Na Ey (a) =q(a,, aj). (5) 


La matriz A=|¡a;,]] se llama matriz de la función p(x, y) en la 
base señalada. Es obvio que conociendo la matriz A conocemos 
también la función q(x, y), ya que la fórmula (5) permite calcular 
los valores de q (x, y) cualquiera que sea el par de vectores x, y. 

La correspondencia entre las matrices y las formas bilineales es 
biyectiva, ya que cualquiera que sea la matriz A la función q(x, y) 
calculada por la fórmula (5) será bilineal de matriz A 

Indicando por [x] e [y] las filas coordenadas de los vectores x 
e y, podemos representar la fórmula (5) en la forma matricial 


p(x, y=1[x) A [y)", (6) 
que permite deducir directamente la siguiente regla de transforma- 
ción de las matrices de funciones bilineales: si en una base la matriz 
de una función bilineal es A, la matriz de la función en una base 
nueva será 

A,=TAT', (7) 


donde T es la matriz del cambio de la base antigua por la nueva. 
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Efectivamente, aplicando la fórmula (6) en las bases antigua y 
nueva, tenemos 


p(x y) =[x] A [y] =([x), TAT” [y], = [x], A, [911 


donde Á,, [x), e [y], son, respectivamente, la matriz de la función 
p(x. y) y las filas coordenadas de los vectores x e y en la base 
nueva. Por esto, A, =T AT". 

Considerando en la fórmula (5) las coordenadas de los vectores 
x e y como variables independientes, vemos que el valor de una 
función bilineal en toda base se expresa mediante una forma bilineal 
cuya matriz coincide con la matriz de la función en esta base. 

Según (7), el paso a una base nueva implica la sustitución de 
la forma bilineal por la correspondiente forma congruente, debido 
a lo cual tas formas bilineales congruentes pueden ser consideradas 
como formas bilineales de una misma función bilineal, pero calculadas 
en diferentes bases. 

Una función bilineal q (x, y) se llama simétrica si 


p(x, y =p (Y. x) d 


p(x, Y) =—9 (x, y). 
Es evidente que /as funciones bilineales simétricas y antisimél ricas 
son aquellas ciones cuyas formas bilineales son, respectivamente, 
simétricas y antisimétricas. 
Si p(x, y) es una función bilineal arbitraria, las iunciones 


y antisimétrica si 


p, (, y=>3[0(x, y+o(Yy, x)] y 
Pa (x, y=>+l9(x, y) — q (y, x)] (8) 


serán bilineales y, respectivamente, simétrica y antisimétrica. Como 
de (8) se deduce que 


P(x, Y) =P, (4, Y) + Da (x, y) 
resulta que toda función bilineal puede ser representada como ta 
suma de funciones simétrica y antisimétrica, con la particularidad 
de que, como es fácil de ver, está representación es unívoca. 

Las funciones de tipo p(x)=Q(x, x), donde q(x, y) es una 
función bilineal, se llaman cuadráticas. Por consiguiente, las fun- 
ciones cuadráticas son aquellas funciones de un vector variable que 
aparecen al identificar los vectores variables en las funciones bili- 
neales. Pero si una función cuadrática w(x) aparece de la forma 
explicada de una función bilineal p(x, y), la función y(x) aparece 
también al identificar las variables en la función bilineal simétrica 
PL (x, y): 


Pr (x, x)= 7 [px + (0 x)] =4 (x, x). 
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Por esto al considerar las funciones cuadráticas se puede aceptar 
que son generadas por funciones simétricas solamente. 
Por otra parte, si p (x, y) es simétrica y p(x) =q (x, x), se tiene 


PATHY=Plx+Y, x+y)=0Q(% x3+2p (x, y) +0 (4, y) 


px, N=>3 [PY 0+9—v(0)—v4)), 


es decir, toda función cuadrática aparece de una función simétrico 
bilineal y sólo una, que se llama polar de la función cuadrática co- 
rrespondiente, 

a Qi, -... 4, una base del espacio y sea y (x) =p (x, x), donde 
p(x, y) es una función bilineal simétrica. Entonces para x=f,a,+... 
. . .+E,Q, tenemos 


Y) =p (x, x) => op (a, ay its, 


es decir, el valor de una función cuadrática se expresa mediante una 
forma cuadrática en las coordenadas de un vector variable, cuya matriz 
coincide con la matriz de la correspondiente forma bilineal polar. 

Razonando análogamente, obtenemos para los valores de una 


función bilineal hermitiana qp(x, y) en lugar de la fórmula (6) la 
fórmula ' 


p( y= Do (a. a)Em) 
es decir, una forma bilineal hermitiana. Al pasar a una base nueva 
la matriz de una función hermitiana varía según la ley 
A, =TAT". 
Una función hermitiana q (x, y) se llama simétrica si 


p(x, y=e(Y, x). 
Los valores de las funciones hermitianas simétricas se expresan 
mediante formas bilineales hermitianas simétricas. 

Las funciones de un vector variable que surgen al identificar 
los vectores variables en las funciones bilineales hermitianas simé- 
tricas se llaman funciones cuadráticas hermitianas. La relación entre 
las funciones cuadráticas hermitianas y las coorrespondientes fun- 
ciones bilineales simétricas hermitianas viene dada por las fórmulas 


Y (x+ iy) =p(x+ iy, + iy) => 
=Q(%, + ilp(x, y) —( 9) +o(y Y, 
P+Y=P(A DAR NH+HP( yY+oly y). (9) 
20 (4, y) =V(x+yY) + ip (x + iy) — 
—(1+ 0 [v0+ 4). 
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Calculando el valor de una función yw(x) cuadrática hermitiana 
para el vector x==E,10,+... +É,4,, donde a,, ..., a, es una base 
del espacio, obtenemos 


pi)=Xo(a, ayEks 


es decir, el valor de una [función cuadrática hermitiana se expresa 
mediante una forma cuadrática hermitiana en las coordenadas del 
vector variable, cuya matriz coincide con la matriz de la correspon- 
diente función bilineal simétrica hermitiana calculada mediante ta 
fórmula (9). 

Indiguemos también que las formas cuadráticas de signo constante, 
consideradas en el p. 22.4, corresponden a aquellas funciones cua- 
dráticas en el caso de un espacio real y a aquellas funciones cua- 
dráticas hermitianas en el caso de un espacio complejo cuyos valores 
no cambian de signo. 


24.2. Espacios de métrica bilineal. Como hemos señalado en el 


p. 17.1, un espacio lineal complejo o real se llama unitario si en 
él está definida una función de dos vectores variables, llamándose 
producto escalar de estos vectores los valores de la misma. Los 
axiomas que hemos indicado en esa ocasión signitican simplemente 
que el producto escalar es una función bilineal hermitiana definida 
positiva. Por esto, el estudio de las propiedades de los espacios 
unitarios no es otra cosa que el estudio, desde un punto de vista 
especial, de las propiedades de las funciones bilineales definidas 
positivas. 

Por analogía con esto diremos que un espacio lineal 2 es bili- 
neal métrico, si en él está definida una función bilineal, cuyos 
valores se llamarán productos escalares de los vectores y se indi- 
carán por (a, b). En el caso en el que el producto escalar sea una 
función bilineal hermitiíana simétrica diremos que el espacio está 
provisto de una métrica bilineal hermitiana. 

Si la matriz del producto escalar es regular, el espacio se lama 
no degenerado. En el caso contrario se dice que el espacio es 


degenerado. 
La matriz 
(a, 41) ... (Q,, Ga) 
G=|(0s 4%) --+ (4 a) 
(Ag, 41) -.. (Am Um) 
formada por los productos escalares de los vectores a,, ..., 4, de 
un espacio bilineal métrico *, se Hama matriz de Gram del sistema 
Qi, +-.» Ap. La matriz de Gram correspondiente a unos vectores 
Gi» --., 4, que constituyen una base del espacio Y, se llama sim- 


plemente matriz de ta función bilineal principal p(x, y)=(x, y) 
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calculada en esta base. De aquí se deduce que las matrices de 
Gram correspondientes a diferentes bases del espacio son congruen- 
tes y, por consiguiente, son del mismo rango. 

n la teoría de los espacios unitarios desempeña un papel 
importante el concepto de ortogonalidad de vectores. Este concepto 
se extiende directamente al caso de espacios bilineales métricos. 

Sea € un espacio bilineal métrico corriente o hermitiano. Se 
dice que un vector a de * es ortogonal a un vector b, si (a, b)=0. 
Si a es ortogonal a b, ello no significa todavía que b sea ortogonal 
a a, ya que en el caso general (a, b) +(b, a). Por esto a veces se 
dice, para una mayor claridad que a es ortogonal a b a la izquierda 
y que b es ortogonal a la derecha a a. De las leyes distributivas (1) 
y (2) se deduce que siendo a ortogonal a varios vectores a,, ..., Ay» 
e] vector a será ortogonal a cualquier combinación lineal de tos 
mismos. De aquí resulta, a su vez, que el conjunto de los vectores 
de un espacio * ortogonales todos ellos a la derecha a los vectores de 
un sistema Wi constituye un subespacio lineal del espacio *. Indica- 
remos este subespacio por Mu. El conjunto de los vectores de 2 
ortogonales a la izquierda a DM también es un subespacio lineal 
que indicaremos a. 

Diremos que un vector x es isótropo a la tzquierda en el espa- 
cio Y, si es ortogonal a ta izquierda a todos los vectores de £. El 
subespacio 1%, formado por todos los vectores isótropos a la iz- 
quierda de £, se llama subespacio isótropo a la izquierda de Y. Análo- 
gamenie se definen los vectores isotropos a la derecha y el subespacio 
isótropo a la derecha 2... 

TEOREMA 1. Las dimensiones de los subespacios isótropos a la 
izquierda y a la derecha son iguales y coinciden con el defecto de la 
matriz de la forma métrica (x, y) calculada en una base cualquiera. 
Por consiguiente, la diferencia entre la dimensión del espacio y la 
dimensión de los subespacios isótropos el igual al rango de la forma 
bilineal métrica; un espacio bilineal métrico es no degenerado cuando, 
y sólo cuando, no contiene vectores isótropos no nulos. 

Tomemos para la demostración una base de £, Entonces Jos 
vectores x isótropos a la izquierda deben verificar para cualquier y 
de 2 la relación 

(x, y)=[x] A [y)' 0, (10) 


donde A es la matriz de Gram de la base tomada. Pero de (10) se 
deduce que 
(x] 4=0 


(aquí O es la fila nula), es decir los vectores isótropos a la iz- 
quierda forman el núcleo de la aplicación lineal de matriz A (p. 10.1) 
y la dimensión del núcleo de una aplicación lineal es igual al 
defecto de la matriz de la aplicación. Análogamente comprobamos 
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que la dimensión del subespacio isótropo a la derecha es igual a la 
dimensión del núcleo de la aplicación lineal de matriz transpuesta 
A” y, por consiguiente, coincide con el defecto de la matriz A que 
es lo que se quería demostrar. 

Todo subespacio lineal A de 2 puede ser considerado por sí sólo 
como un espacio bilineal métrico hermitiano o corriente, respecti- 
vamente, respecto al mismo producto escalar que opera en Y“. En 
el caso general, si Y es no degenerado, ello no implica todavía que 
sus subespacios sean no degenerados y recíprocamente, si un subes- 
pacio Y es no degenerado, esto no implica que todo el espacio 
sea no degenerado. 

TEOREMA 2. Si YA es un subespacio no degenerado del espacio *, 
para % tienen lugar las descomposiciones directas 

LI + AL =29 + A. (11) 
Reciprocamente, sí al menos una de las descomposiciones (11) es válida, 
el subespacio A es no degenerado. 

Efectivamente, la intersección A n A es el subespacio isótropo 
a la derecha de Y. Como Y es no degenerado, tenemos Y N Al =0 
y, por consiguiente, la suma A+A-L es directa. 

Sea ahora c un vector cualquiera de *. Tomemos 


(a, )=Y, (I=1, ..., m), 
donde 4,, ..., G, es una base de A. El sistema auxiliar de ecua- 
ciones 
(a, a,) E +(a), a) En + ... + (4), Am) En => Y 
U=l,..., m) 
puede ser resuelto respecto a E,, ..., Ex, ya que su determinánie 
es el determinante de la matriz de Gram del sistema a,, ..., 4n y 


es diferente de cero debido a que Y es no degenerado. El vector 
assE,a, +... End, pertenece a A y, además, 


(a, c—aj=0 (Jul, ..., m), 


es decir, c—a€ 911. Puesto que para todo c es válida la descom- 
posición 

ecsa+(c—a) (a€lA y c—ac Az), 
resulta que Y es la suma de A y AL que es lo que se quería 
demostrar. 

Unos espacios bilineales métricos sobre un mismo cuerpo con- 
mutativo de coeficientes se llaman ¿somorfos, cuando entre sus ele- 
mentos se puede establecer una correspondencia biyectiva que trans- 
forma una suma de vectores en la suma correspondiente, el producto 
de un número por un vector en el producto del mismo número por 
el vector correspondiente y el producto escalar de un par de vecto- 
res en el producto escalar del par de vectores correspondientes. 
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De la última condición se ve, en particular, que en una corres- 
pondencia isomorfa las matrices de Gram de los sistemas correspon- 
dientes de vectores coinciden. Viceversa, si en dos espacios bilinea- 
les métricos sobre un mismo cuerpo conmutativo existen bases cun 
las mismas matrices, los espacios son isomortos. 

Para los espacios lineales corrientes y unitarios hemos demostrado 
antes que existe un espacio único, salvo un isomorfismo, de dimen- 
sión n. Para los espacios bilineales métricos la situación es más 
compleja. 

Demostremos, ante todo, la siguiente afirmación casi evidente: 

TEOREMA 3. Unos espacios bilineales métricos sobre un mismo cuer pc 
conmutativo son isomorfos cuando, y sólo cuando, tas matrices de Gram 
unas bases arbitrarias, escogidas en estos espacios, son congruentes, 

La necesidad es clara, ya que las matrices de Gram de todas 
las bases de un espacio dado son congruentes y las matrices de Gram 
de las bases correspondientes de espacios isomorfos coinciden. Por 
otro lado, si A y B son las matrices de Gram de unas bases de 
unos espacios Y y £, y A y B son congruentes, en £ existe tam- 
bién una base de matriz B, de acuerdo con los resultados del punto 
anterior. 

El teorema 3 significa que el problema de la clasificación de 
espacios bilineales métricos no isomorfos es idéntico al problema de 
la clasificación, salvo una congruencia, de las formas bilineales; 
este problema ha sido ya examinado en el p. 23.3. Nos limitaremos 
aquí a enunciar, en términos de la teoría de espacios bilineales 
métricos, algunos corolarios de los resultados del punto mencionado. 

Los espacios bilineales métricos reales no degenerados de métrica 
simétrica (x, y) =(y, x) se llaman seudoeuclideos. 

La matriz de Gram Á de una base arbitraria de un espacio 
seudoeuclídeo es simétrica real. Según el teorema 1 del p. 21.3, la 
matriz Á es congruente a una matriz diagonal con los números 
+10 —l en la diagonal principal. En otras palabras, en todo 
espacio seudoeuclídeo de dimensión n existe una base en la que el 
preducto escalar de los vectores de coordenadas E,, ...,ÉE, Y Ny» - ++ Mn 
se expresa mediante la forma 


(x, y) =E,m, + ... + E) —Ey+1 Uy +. — Gp 1a- 


El número o =s—(n—s) se llama signatura del espacio. 

Por consiguiente, los espacios seudoeuclideos se determinan, salvo 
un ¡somorfismo, por su dimensión y su signatura. Además, para 
cualquier rn >0 y cualquier s (U<s<m) existe un espacio seudoeu- 
clídeo de dimensión n y de signatura s— (1 — ss). 

Los espacios bilineales métricos no degenerados de métrica anti- 
simétrica (x, y) =-— (y, x) se llaman simpliciales. 

La matriz de Gram de una base de un espacio simplicial es 
antisimétrica y por esto, debido al p. 15.5, es congruente a una 
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matriz celular diagonal con células de upo | 91 a lo largo de 


—] o! 
la diagonal principal. Por consiguiente, la dimensión de un espacio 
simplicial es siempre un número par y para todo n existe, salvo un 
isomorfismo, un espacio simplicial único de dimensión 2n. En todo 
espacio simplicial de dimensión 2n existe una base en la que el pro- 
ducto escalar es de la forma 


(x, y) = EM) — EM ++ Hb 2 Van — Eso Men 19 


donde E, .--. Em Y WM ->-: Man son las coordenadas de los vecto- 
res x e y. 

Un espacio bilineal métrico complejo no degenerado de métrica 
simétrica se llama euclideo complejo. Puesto que toda forma bilineal 
simétrica regular se puede reducir sobre el cuerpo de los números 
complejos a la forma de matriz unidad, para toda dimensión n 
existe, salvo un isomorfismo, un espa:io euclídeo complejo único. 
En todo espacio euclideo de dimensión a existe una base en la que el 
producto escalar es de la forma 


(y) =E0, +5 +... +5... 
Finalmente, los espacios complejos no degenerados de métrica 


simétrica hermitiana (x, y) =(y, x) se llaman seudounitarios. Del 
teorema 2 del p. 21.3 se deduce que en todo espacio seudounitario 
de dimensión n existe una base en la que el producto escalar es de la 
forma _ e e 

(x, y) =EN,+ ... + E. —Es+1 gr... — EnMa: 

El número o=s—(n-—s) se llama signatura del espacio seudou- 
nitario. Con la dimensión +“ determina, obviamente, el espacio 
seudounitario, salvo un isomorfismo. 

En cuanto a la clasificación de espacios bilineales métricos com- 
plejos no degenerados cualesquiera, ésta se obtiene en base al teo- 
rema 4 del p. 23.3. Para caracterizar el espacio es necesario en 
este caso escribir el conjunto de divisores elementales sujeto a las 
condiciones indicadas al final del p. 23.3, 


24.3, Funciones bilineales en espacios bilineales métricos. En el 
punto anterior hemos logrado geometrizar la teoría de una función 
bilineal, definida sobre un espacio lineal £, gracias a que hemos 
considerado los valores de la función bilineal como los productos 
escalares de los vectores, definiendo asi una métrica especial en *. 
Análogamente, para geometrizar la teoría de pares de funciones bili- 
neales, definidas sobre un espacio lineal *, una de ellas se toma 
como la función métrica y la otra se considera como una función 
bilineal definida sobre un espacio bilineal métrico. Está claro que 
el par p(x, y), p,(x, y) y el par p(x, y), q, (x, y) serán ahora seme- 
jantes respecto a los automorlismos de un espacio lineal Y cuando, 
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y sólo cuando, la función q, (x, y) puede ser reducida a la función 
, (x, y) mediante un automorfismo del espacio bilineal métrico Y de 
función métrica principal q (x, y). 

Es más, en los espacios bilineales métricos no degenerados es 
posible relacionar biyectivamente con toda función bilineal una 
aplicación lineal del espacio. Puesto que esta relación no depende 
de cómo se escoja la base, resulta así que el estudio de las funcio- 
nes bilineales equivale al estudio de las aplicaciones lineales de 
espacios bilineales métricos. Desde el punto de vista de la teoría 
de espacios lineales, esto significa que el estudio de pares de fun- 
ciones bilineales, de las cuales una es no degenerada, equivale al 
estudio de pares formados por una función bilineal no degenerada y 
por una aplicación lineal. 

Sea, pues, £ un espacio bilineal métrico no degenerado hernii- 
tiano o corriente. 

TEOREMA 4. Toda función lineal f(x) definida sobre Y puede ser 
representada untuvocamente en la forma (x, a). 

Efectivamente, la condición f(x) =(x, a) equivale al sistema de 


relaciones 
(a, a)=f (a) (f=l, 0,2), (12) 


donde a,, ..., a, es una base de Y. Tomando a=E,a0,+...-+E,4, 

considerando (12) como un sistema de ecuaciones respecto a 
E . ., ÉE,, Vemos que éste es un sistema de n ecuaciones lineales 
con nr incógnitas de determinante diferente de cero, ya que el último 
es el determinante de la matriz de la forma principal en la base 
escogida. Por consiguiente, las ecuaciones (12) tienen una solución 
única. 

Igual que esto ha sido hecho en el p. 18.2 para los espacios 
unitarios, el teorema 4 puede ser empleado para introducir en £ el 
concepto de la aplicación conjugada. 

Consideremos una aplicación lineal cualquiera A de este espacio. 
La expresión (x4, a) representa para todo vector dado a una fun- 
ción lineal de x. Según el teorema 4, en el espacio Y existe un 
vector determinado b tal que 


(xA, a) = (x, b) (13) 


para todo x. Indiquemos por 4” la aplicación que transforma a en b. 
Entonces b=a4* y la igualdad (13) puede ser representada en la 
forma 

(XA, a) = (x, ad”). (14) 


La aplicación 4* se llama conjugada a la derecha de 4. La propie- 
dad (14) caracteriza plenamente la aplicación conjugada a la derecha. 
Efectivamente, si para una aplicación B tenemos (x4, a) =(x, a33) 
cualesquiera que sean a y x, comparando esta igualdad con (14) 
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encontramos la relación (x, aA*—aB)==0 de la cual resulta que 
ad*—agB es un vector isótropo del espacio *. Puesto que Y no 
contiene vectores isótropos no nulos, tenemos a4*—aB=0 y 4*= 3H. 


Repitiendo los razonamientos del p. 18.2 es fácil demostrar 
que 4* es lineal y que son válidas las fórmulas corrientes 

AFD = A HER, (15) 

ABRA", (16) 

(ad”) = ad” (07 


ara los espacios bilineales métricos corrientes y las fórmulas (15), 
16) y 


(ak) =0a4* (18) 


para los espacios bilineales métricos hermitianos. 

Resolvamos ahora el problema sobre la relación que existe entre 
las matrices de la aplicación 4 y de su conjugada a la derecha .4*. 
Tomemos para ello una base en Y e indiquemos las matrices de las 
aplicaciones 4 y A” por A y Bi, respectivamente. Sea Y un espacio 
corriente. Basándonos en las fórmulas (6) del p. 24.1, obtenemos 


(xt. a)= [x4] G [a]" =[x] AG [a]”, 
(x, a4*) =[x] G [a4*]'=(x] GB” [a]”, 
donde G es la matriz de Gram del espacio Y en la base escogida. 


De aquí 
AG=GB" y B'=G-1AG, (19) 


En el caso de espacios bilineales métricos hermitianos las fórmu- 
las (19) se sustituyen por las relaciones 


AG=GB" y B'=G" AG. (20) 


Hemos visto que en los espacios unitarios existen sistemas orto- 
normales de coordenadas. En estos sistemas la matriz de Gram se 
convierte en la matriz unidad y las relaciones (20) nos ofrecen el 
resultado conocido (p. 18.2): B'=A. 

Hemos definido hasta el momento sólo la aplicación conjugada 
a la derecha. Es obvio que de Ja misma forma se puede introducir 
también la aplicación conjugada a la izquierda. Es decir, sea 4 
una aplicación lineal de *. Repitiendo los razonamientos realizados 
anteriormente, veremos que en %* existe una aplicación única $ que 
cumple la igualdad 

(x, 04) = (x6, a) 


cualesquiera que sean x y a. 
La aplicación $8 es lineal. Convedremos en llamarla conjugada 
a ta izquierda de 4 y en indicarla por *4. 
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Si la métrica de % es simétrica o antisimétrica, las aplicaciones 
conjugadas a la derecha y a la izquierda de cualquier aplicación lineal 
coinciden, ya que 


(XA? y)= E lY, AD) == (yA, x) == (x, yA) = (A, y). 


Pasando a la consideración de las funciones bilineales sobre 2, 
observemos ante todo que el valor de la expresión (x.4, y), donde .£ 
es una aplicación lineal, representa una función bilineal y, respecti- 
vamente, una función bilineal hermitiana en *£. 

Si las aplicaciones lineales A y BH son diferentes, las funciones 
bilineales correspondientes (xA, y) y (xB, y) también son diferentes. 

En efecto, lo contrario significaría que (x4, y) =(x3, y) para 
todos los x e y de Y. De aquí resultaría (x4=—x32B, y)=0 para 
todos los valores de y, es decir, xu4—x%B sería un vector Isótropo 
a la izquierda. Puesto que Y no contiene vectores isótropos no nulos, 
tendríamos xA =x3, es decir, 4 =3B. 

Probemos ahora que toda función bilineal f(x, y) definida sobre * 
puede ser representada en la forma (xA, y), donde 4 es una aplica- 
ción lineal del espacio %. En esta proposición debe comprenderse 
por f(x, y) una función corriente, si £ es un espacio bilineal mé- 
trico corriente, y una función hermitiana, si * es un espacio bilineal 
métrico hermitiano. 

Efectivamente, para todo valor dado de y, f(x, y) es una función 
lineal de x. En virtud de! teorema 4, esto significa que para lodo y 
existe un vector 2, determinado unívocamente, tal que la relación 
f(x, y) =(x, 2) es válida para cualesquiera valores de x. Indiquemos 
por 3 la aplicación que transforma y en 2; entonces 


Fa, y) =(<, y3). (21) 
En el caso de un espacio bilineal métrico hermitiano tenemos 


f(x, ay, + By.) =af (x, y,) +Bf (X, Ya) =0 (x, y, B) +B(x, YB) = 
= (x, « (y, 2) ER B (Y,B)). 
Por otro lado, debido a (21), 
Fx, ay, + By,) =(x, (ay, + By.) D). 
De aquí tenemos 
(ay, +By) B=a (YB) + B (4,D), 


es decir, YM es una aplicación lineal. Lo mismo tiene lugar en el 
caso de los espacios bilineales métricos corrientes. Indicando por 4 
la aplicación conjugada a la izquierda de 3, podemos representar (21) 
en la forma f(x, y) =(x.4, y). Hemos obtenido, pues, el teorema 
siguiente: 

TEOREMA 5. Sí 2 es un espacio bilineal métrico no degenerado co- 
rriente q hermitiano, la expresión (xA, y), donde A es una aplicación 
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lineal del espacio Y, representa una función bilineal corriente o her- 
mitiana, respectivamente, sobre *. Viceversa, para toda función bili- 
neal f(x, y) corriente o, respectivamente, hermitlana definida sobre £ 
existe una aplicación lineal A de este espacio, determinada univoca- 
mente, tal que f(x, y) ==(x4A, y) para cualesquiera x e y de Y. 

El teorema 5 establece una correspondencia biyectiva entre las 
funciones bilineales y las aplicaciones lineales de los espacios bili- 
neales métricos no degenerados que permite reducir el estudio de 
las funciones bilineales al estudio de las aplicaciones lineales de 
estos espacios. Desde el punto de vista de la teoría de pares, el 
teorema 5 significa que el estudio de los pares de funciones bilinea- 
les, al menos una de las cuales es regular, puede ser reducido al 
estudio de los pares mixtos compuestos de una función bilineal 
regular y de una aplicación lineal. 

Veamos cómo están relacionadas las matrices de una función 
bilineal f(x, y) y de su correspondiente An lineal 4. Tome- 
mos en £ una base cualquiera y sean y Á las matrices de la 
función f(x, y) y de la aplicación 4, respectivamente. Tenemos, 
según la fórmula (6) del p. 24.1, 


Er y=l)P [9 y (x4, y =[x4]6 [y]' =[x] AG [y]”. 


de donde 
F<=AG, (22) 


donde GQ es la matriz de Gram del espacio 2 en la base escogida. 
Es fácil comprobar que esta fórmula tiene lugar también en el caso 
de los espacios bilineales métricos hermitianos. 

Una aplicación lineal 4 de un espacio bilineal métrico £ se 
llama simétrica si 


(XA, Y) =(x, yA) (23) 
cualesquiera que sean x e y de *. Una aplicación 4 se llama antisi- 
métrica Si 

(XA, y) =— (x, yA). (24) 

Comparando (23) y (24) con las fórmulas que definen las aplicaciones 

conjugadas a la derecha y a la izquierda, obtenemos en lugar de 
(23) y (24) las relaciones equivalentes 

A=A'='"4A, (25) 

A=—At=—"4. (26) 

Sea £ un espacio de métrica simétrica y sea A una aplicación 


lineal simétrica del espacio £, La función bilineal correspondiente 
a la aplicación A es de la forma 


Fx, y) >= (x4, y). 
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Si el espacio * es corriente se tiene 
PF y =(xA, y) =(Y, xd) =(yA, x) =$ (Y, X). 
Si el espacio Y es hermitiano, tenemos respectivamente 


Hx, y =(A, y) =(y, x4) =(yul, x) =HHy, x). 
Por consiguiente, f(x, y) es en ambos casos una función simétrica. 
Los mismos razonamientos muestran que la simetria de f(x, y) 
implica la simetría de la correspondiente aplicación lineal 4. Aná- 
logamente, la antisimetría de la aplicación 4 equivale a la anti- 
simetría de la correspondiente función f (x, y). 

Si la métrica del espacio Y es antisimétrica, la relación entre 
la simetría y la antisimetría de las aplicaciones lineales y de las 
funciones bilineales es la inversa: a las aplicaciones simétricas les 
corresponden funciones antisimétricas y a las aplicaciones antisi- 
métricas les corresponden las funciones simétricas. Efectivamente, 
si .¿ es una aplicación simétrica de un espacio bilineal métrico 
corriente Y provisto de una métrica antisimétrica, tenemos 


Hx, y) =(xA, y) = — (Y, xd) =— (yA, x) = —f (y, x). 


Análogamente se demuestran las demás afirmaciones. Hemos llegado 
asi al teorema siguiente: 


TEOREMA 6. Sí Y es un espacio no degenerado corriente o hermitiano 
provisto de una métrica simétrica, a las funciones bilineales simétri- 
cas les corresponden aplicaciones tineales simétricas del espacio Y y a 
las funciones antisimétricas les corresponden aplicaciones antisimétri- 
cas. Si ta métrica del espacio Y es antisimétrica, al contrario, a las 
funciones antisimétricas les corresponden aplicaciones simétricas y a 
las funciones simétricas les corresponden aplicaciones anlisimétricas. 

Volviendo a la teoria de pares, vemos del teorema 6 que el 
estudio de los pares de funciones bilineales simétricas o antisimétricas 
equivale al estudio de las aplicaciones lineales simétricas o antisi- 
métricas en los espacios de métrica simétrica o antisimétrica. 


Ejemplos y problemas 


1. La matriz de Gram de un espacio métrico bilineal L en una base aj, as, 
ay y Q, es igual a 


l|—3 —-7 —2 
2 17 3 
3=2 0 1|” 
4-1 5 3 


Demuéstrese que el subespacio isótropo a la izquierda de 2 tiene la base 
41 + 42¿—4yg Y +62, —7a, y que el subespacio Isótropo a la derecha tiene la 
base 24, +34 —43 y 01 +49 —44. 


9” 
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2. Para que un espacio bilineal métrico se descomponga en una suma directa 
de subespacios ortogonales a ambos lados es necesario y suficiente que su matriz 
de Gram se descomponga en una base. 

3. Si la matriz de Gram de un espacio bllineal métrico no degenerado f 
es G, la aplicación lineal de matriz G'G”=' del espacio £í es un automorfismo 
del mismo. 

4. Demuéstrese que cualquiera que sea un subespacio no degenerado YU de 
un espacio bilineal métrico £, las dimensiones de UL y de 2X son iguales a la 
diferencia de las dimensiones de € y de Y. Demuéstrese, en particular, que 
L(911) =(L91)L 9. 

5. Todo espacio provisto de una métrica simétrica o antlsimétrica es una 
suma directa de unos subespacios isótropo y no degenerado. 

6. Si en un espacio bilineal métrico É son equivalentes los conceptos de 
ortogonalidad a la derecha y a la izquierda, £ es o bien un espacio de métrica 
simétrica o bien un espacio de métrica antisimétrica. 

7. Las funciones Y» que cumplen la identidad 


By (ax + y) + ap (e— By) = (1 4-28) (ap (x) + Br (y), 


y sólo estas funciones, son cuadráticas sobre un espacio lineal. 

. Sea / una matriz cuadrada fija. Una matriz A se llama /-ortogonal, si 
AlA"=1, se llama /-simétrica, si Al=lIA", y se llama /-antisimétrica, si 
Al =-— JA'. Demuéstrese que si en una base de un espacio bilineal métrico la 
matriz de Gram coincide con f/, en esta base las aplicaciones isométricas tienen 
matrices /-ortogonales y las aplicaciones simétricas y antisimétricas tienen ma- 
trices /-simétricas e 7/-antisimétricas, respectivamente. 


Capítulo VII Aplicaciones lineales 
de espacios bilineales 
métricos 


En el capítulo presente será considerada la clasificación de tos 
principales tipos de aplicaciones lineales (simétricas, .antisimétricas 
e isométricas) de espacios provistos de métrica bilineal. La relación 
que existe entre esta clasificación y la clasificación de los pares de 
formas bilineales ha sido explicada en el $ 24 del cap. VI y se 
supone que el lector que pase al estudio de este capítulo está fami.- 
liarizado con los resultados de aquel parágrafo. 

En este capitulo, al igual que en el anterior, se supone que 
todos los espacios que aquí aparecen son espacios sobre un cuerpo 
conmutativo (pero no sobre un cuerpo cualquiera). 


$ 25. Tipos principales de aplicaciones lineales 


25.1. Automorfismos. Según el p. 24.2, una aplicación lineal 


regular “Y de un espacio bilineal métrico Y se llama automorfismo 
del espacio £, si Y no altera la magnitud del producto escalar, es 


decir, si 
(U, yU) =(x, y) (1) 


para todos los x e y de %. Los automorfismos del espacio Y tam- 
bién se llaman a veces aplicaciones isométricas del mismo. Empleando 
los conceptos de las aplicaciones conjugadas a la derecha y a la 
izquierda, podemos representar la relación (1) en la forma 


(a, y) =(-U, yU) =(x, y UU”) =(xUU, y), 
de donde se tiene 
UV = UU =ÉE. (2) 


Está claro que, recíprocarmente, la relación (2) implica la relación (1). 
Por consiguiente, para que una aplicación lineal U de un espacio 
bilineal métrico no degenerado sea: un automorfismo es necesario y 
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suficiente que ambas aplicaciones conjugados de U coincidan con la 
inversa de U. 

Tomemos en Y una base e indiquemos por U la matriz de la 
aplicación U. Si el espacio £ es corriente, la relación (1) se con- 


vierte en 
(x] UGU" [y)' =(x] G [y]. 
donde G es la matriz de Gram. De aqui resulta 
UGU' =G. (3) 
Si el espacio L es hermitiano, de (1) se tiene 


[x] UGU" [y)]' =(x] G [3]', 
es decir, a 
UGU'=G. (4) 


Las igualdades (3) y (4) representan las condiciones que deben 
cumplir las matrices de las aplicaciones [sométricas de los espacios 
bilineales métricos no degenerados corrientes y hermitianos, respec. 
tivamente. 

Dos aplicaciones lineales 4, y 4, de un espacio bilineal métrico £ 
se llaman ¿somorfas, si existe una aplicación isomosfa U del espacio Y 
sobre sí mismo que transforma 4, en 4,. Tenemos, de acuerdo con 


el p. 10.2, 
A, = ULA U. (5) 


La aplicación YU es un automorfismo del espacio € y, por ello, la 
relación (5) significa que el isomorfismo de las aplicaciones lineales 
de espacios bilineales métricos equivale a la semejanza de las mismas 
respecto a fas aplicaciones isométricas. De aquí se deduce, en virtud 
de los resultados del p. 15.3, que las aplicaciones lineales ¡somorfas 
tienen factores invariantes iguales. En el caso general, este criterio 
no es suficiente para el isomorfismo de unas aplicaciones. Sin em- 
bargo, la situación es diferente, si se consideran aplicaciones simé- 
tricas, antisimétricas o isométricas. 

TEOREMA 1. Sea * un espacio no degenerado corriente sobre el cuerpo 
de todos los números complejos provisto de una métrica simétrica o 
antisimétrica. Entonces para el isomorfismo de unas aplicaciones si- 
métricas, antisimétricas o isométricas del espacio Y es necesario y 
suficiente que los factores invariantes de estas aplicaciones coincidan. 

La necesidad ha sido demostrada anteriormente y, por esto, con- 
sideraremos sólo la suficiencia. Sean 4, y 4, las aplicaciones lineales 
dadas. Por hipótesis, los factores invariantes de 4, y de «4, coin- 
ciden y, por consiguiente, 


A=9 ASÍ, (6) 
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donde Y es una aplicación lineal regular del espacio €. Pasando en 
ambos miembros a las aplicaciones conjugadas, obtenemos ! 

As =T A Í 71. (7) 
Si 4, y 4, son simétricas o antisimétricas, se tiene 4 ==k A, y 
Ar=>=+H A, y (7) se convierte en 

Án =Y "A, T*”" (8) 


En cambio, si 4, y «4, son isométricas, tenemos 4;¡= Aj" 
Az = Ay”. Introduciendo estos valores en (7) y elevando el resultado 
a la potencia —!, obtenemos de nuevo (8). Debido a (6) y (8) 
tenemos Y "AH =H *A, TF **, de donde 


A TT SIT" A. (9) 
De (9) se desprende directamente que 
ATT YA TT Y Ay (R=1, 2, ...) 


y, én general, 
ATT) TT) A, 


donde f(A) es un polinomio arbitrario (compárese con el p. 23.2). 
ún el teorema sobre la extracción de la raíz cuadrada (p. 16.3), 
el] polinomio f (4) se puede escoger de modo que 


HIS UN TITA=T ST". 
Tomando 
DENT) y UDS, 
obtenemos 
DEA NITTN NITO, 
WESTD=F DA, 
UV = DATTIDO =D NIT DA 2 DODD AO S|E 


Por consiguiente, U es una aplicación isométrica. Al mismo tiempo 
de 1,D=WM4, se deduce que ñ 


UTA US DADA <= TA DD ST 2 IAS A, 


que es lo que se quería demostrar. 

El teorema | muestra que en los espacios euclídeos complejos, 
así como en tos espacios complejos simpliciales, para clasificar, 
salvo un tsoinorfismo, las aplicaciones simétricas, antisimétricas e 
isométricas es suficiente saber qué divisores elementales pueden 
contener estas aplicaciones. 


1) Como la métrica dé L es simétrica o antisimétrica, las apltcaciones con- 
jugadas a la derecha y a la izqulerda coinciden, 
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TEOREMA 2. Si una aplicación isométrica U de un espacio bilineal 
métrico no degenerado corriente $ contiene k veces el divisor elemen: 
tal A —ay”, la aplicación U contiene también R veces el divisor ele- 
mental (A a” 1)”. 

La afirmación del teorema no tiene contenido para a ==> 1. Por 
esto aceptaremos que a + +1. Tomemos en Y una base e indiquemnos 
po U la matriz de la aplicación YU. En virtud de (3), tenemos 

GU' =G, donde G es la matriz de Gram. De aquí resulta 


U*=G-U-=*G. (10) 


Los divisores elementales de la matriz U” coinciden con los divisores 
elementales de la matriz U, La fórmula (10) muestra que, a su 
vez, los divisores elementales de la matriz U” coinciden con los 
divisores elementales de la matriz U”* (compárese con el p. 15.3). 
Es decir, los divisores elementales de la matriz U deben ser los 
mismos que los de Ja matriz U”!, Pero, según el teorema sobre 
los divisores elementales de las funciones (p. 16.4), los divisores 
elementales de la matriz U”* se obtienen de los divisores elemen- 
tales (A—a)” de la matriz U sustituyendo a por a”*. Por consi- 
guiente, si en todo divisor elemental de tipo (A—a)” de la matriz U 
sustituimos a por a”*, obtendremos de nuevo un divisor elemental 
de la matriz U que es lo que se quería demostrar. 

En el caso de espacios bilineales métricos hermitianos la rela- 
ción (10) se convierte en 


U* =G7"*U*16G. 


Con arreglo a esto también cambia la afirmación sobre los divisores 
elementales: sí (A—a)” es un divisor elemental de multiplicidad k de 
una aplicación isométrica de un espacio bilineal métrico no degenerado 
hermitiano, la expresión (A—7*)" también será un divisor elemental 
de multiplicidad R de esía aplicación. La demostración es la misma. 

TEOREMA 3. Sean a y b dos vectores radicales de una aplicación 
isométrica U de un espacio bilineal métrico corriente Y. Si los va- 
lores propios a y B, a los que corresponden estos vectores, no son 
recíprocamente inversos, es decir, si af 51, los vectores a y b son 
ortogonales. Análogamente, si Y es un espacio bilineal métrico hermi- 
tiano y a 1, los vectores a y b son también ortogonales. 

La demostración es la misma tanto para los espacios corrientes 
como para los hermitianos. Por esto consideraremos sólo los espacios 
corrientes. Por hipótesis, 


alab — Uy =0 y L(PS—U) =0 (ap 1), (11) 


donde s y f son unos números enteros mo negativos. Debemos de- 
mostrar que de las relaciones (11) se desprende la igualdad (a, b) =0. 
Realizaremos la demostración por inducción según los valores de 
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la suma s+f. Sis4+f=0, se tiene s =f=0 y de las relaciones (11) 
resulta a=b=o, de donde (a, b)=0. 

Supongamos ahora que tenemos dado un valor de la suma s +f 
y que para todos los valores menores que esta suma la afirmación 
ha sido ya demostrada. Tomemos 


a(ab —U)=a, y b(BS— U) =b,. 
a, (28 —Uy"* =a (a8 — Uy =0, 
b, (BS —U)"* =b(B6 — UY =0, 
tenemos por inducción 
(a, b,)=(a,, b)=(4,, b,) =0. 
Pero la igualdad (a, b,) =0 implica que (a, b(PS — U)) =0, es decir, 


Puesto que 


(a, HU) =P (a, 6). (12) 
Análogamente, de la igualdad (a, b)=0 se deduce: 
(AU, b)—a(a, d). (13) 


Finalmente, de la igualdad (a,, b,) =0 resulta: 
0 == (a (ab — U), D(PBS—U)) = 
=0aB (a, b)—a (a, HU)—B (aU, db) + (aU, DU), 
de donde, debido a (12) y (13), obtenemos 
=— op (a, b)+(a, b). (14) 


Puesto qe af 1, la igualdad (14) ofrece la relación requerida 
(a, b)= , 

TEOREMA 4 Si A es una aplicación isomélrica, simétrica o anti- 
simétrica del espacio £ y el subespacio U es invariante respecto a A, 
los subespacios ortogonales a Y a la derecha y a la izquierda son 
también invariantes respecto a A. 

Sea A una aplicación isométrica del espacio £. El subespacio 
ortogonal a la derecha UL está formado por los vectores b que 
cumplen la relación (a, b)=0 cualquiera que sea a de A. Puesto 
que 4 es una aplicación regular, el subespacio A es invariante 
también respecto a 47*. Por consiguiente, el vector ax”! perte- 
nece a YA, de donde tenemos (a4”*, b)=0. Pero 


(ad”*, b)=(a4A“*A, bA)=(8, 04); 


es decir, (a, b4)=0 pas todo a de A. Por consiguiente, el vector 
bA figura en Mi y el subespacio Y es invariante respecto a 4. 
También sencillas son las demostraciones de las demás afirmaciones. 

TEOREMA 5. Supongamos que un espacio bilineal métrico corriente 
o hermitiano Y se descompone en una suma directa de sus subespactos 
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L£,*L, ..., €, ortogonales a ambos lados. St todos estos subes- 
pacios son invariantes respecto a una aplicación lineal A del espacio 2 
y si la aplicación A es isométrica o, respectivamente, simétrica o 
antisimétrica sobre cada uno de los subespacios %,, ..., 2,, la apli- 
cación A será del mismo tipo sobre el espacio %. 

Este teorema explica cómo pueden emplearse las descomposl- 
ciones directas para el estudio de las propiedades de las aplicacio- 
nes lineales de los tipos señalados. Su demostración es evidente y 
queda a cargo del lector. 


25.2. Aplicaciones simétricas y antisimétricas. Recordemos que 
una aplicación 4 de un espacio bilineal métrico corriente o hermi- 
tiano se llama simétrica si 


(14, y) =(x, yA) 


para cualesquiera x e y de %. 

TEOREMA 6. Los vectores radicales a y b correspondientes a dife- 
rentes valores propios p y «u de una aplicación simétrica A de un 
espacio bilineal métrico corriente o hermitiano son ortogonales. 

Efectivamente, tenemos, por hipótesis, 

apS—AJ=0 y bob —AY=0, (15) 
donde s y f son unos números enteros no negativos. Debemos de- 
mostrar que de (15) se desprende la ortogonalidad de los vectores 
a y b. Realizaremos la demostración por inducción según los valo- 
res de la suma s+1. Para s+t=1 0 bien so bien 1 es igual a 
cero y, por consiguiente, o bien a=0 0 bien b==0, de donde (a, E 0. 

Supongamos ahora que tenemos dado un valor de la suma s+É 
y que para todos los valores menores que esta suma la afirmación 
ha sido ya demostrada. Sea 

a, =a(pé—A) y b,=b(06—A). 
Tenemos 

a, (08 —A)* =a (pS —A)'=0, 
b (08 —AJ"! =b(08$ —4)' =0, 


Por esto, de acuerdo con la hipótesis de inducción, resulta 
(a, 6,)=(a,, 0)=0, 


gc(a, b)b=(a, dbA) y pla, b)=(aví., b). 


Puesto que la aplicación 4 es simétrica, los segundos miembros de 
estas igualdades coinciden y, por consiguiente, (s—p) (a, b) -=0, de 
donde se tiene (a, b)=0 que es lo que se quería demostrar. 

Una aplicación .4 de un espacio bilineal métrico corriente que 
cumple la relación 


es decir, 


(xk, y) =— (x, yA) 
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para todos los x e y de Y se llama, de acuerdo con el p. 24.3, 
antisimétrica. 

TEOREMA 7. Sean a y b unos vectores radicales de una aplicación 
antisimétrica de un espacio bilineal métrico corriente correspondientes 
a los valores propios p y 0. Si p+- 090, se tiene (a, b)=0. 

La demostración coincide casi textualmente con las demostra- 
ciones análogas de los teoremas 3 y 6 y puede ser aquí omitida. 

Las aplicaciones isométricas de un espacio bilineal métrico no 
degenerado cualquiera X están estrechamente ligadas a las aplica- 
ciones antisimétricas del mismo. Tiene lugar concretamente el si- 
guiente teorema que, por la forma en la que se enuncia, coincide 
plenamente con el teorema del p. 20.3 sobre la aplicación de Cayley. 

TEOREMA 8. Sea Y un espacio bilineal métrico corriente o hermi- 
tiano. Sí A es una aplicación antisimétrica del espacio % que no 
tiene valores propios iguales a —1, la aplicación 


U=(E— A) (6 + A)” (16) 


es una aplicación isométrica del espacio % que tampoco tiene valores 
propios iguales a —1 y, además, 4 se expresa mediante U por la 
fórmula 


A=($6— UNS +U)"+. (17) 


Reciprocamente, sí U es una aplicación isométrica del espacio % 
que no tiene valores propios iguales a —1, la aplicación A calcu- 
lada mediante la fórmula (17) es antisimétrica y tampoco tiene va- 
lores propios iguales a —1 y U se expresa en términos de A median- 
te la fórmula (16). 

Igual que en el caso de espacios unitarios, las fórmulas (16) y 
(17) llevan el nombre de aplicaciones de Cayley. La demostración 
de las mismas coincide textualmente con la demostración de estas 
fórmulas realizada en el p. 20.3 para los espacios unitarios. Por 
esto omitimos aquí la demostración. Observemos que unas fórmulas 


análogas 
=— (6 —A NS + A)", (18) 
A=(8 + UNS — Uy" (19) 


ofrecen una correspondencia entre las aplicaciones antisimétricas 
del espacio Y que no tienen valores propios iguales a —1 y las 
aplicaciones isométricas del espacio Y que no tienen valores propios 
iguales a +1. 

Las aplicaciones de Cayley podrían reducir totalmente el estudio 
de las aplicaciones isométricas al estudio de las antisimétricas, si 
no figurasen los valores propios excepcionales +- 1. La existencia 
de estos valores hace necesario el estudio independiente más deta- 
ltado de las propiedades de Jas aplicaciones isométricas. 

Para terminar demostremos que tiene lugar el teorema siguiente: 
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TEOREMA 9. Si (A—a)” figura R veces en el sistema de divisores 
elementales de una aplicación antisimétrica A de un espacio bilineal 
métrico no degenerado corriente *, la expresión (A+ a)” también 
figura R veces en el sistema de los divisores elementales de la apli- 
cación 4. 

Efectivamente, la matriz B de la aplicación conjugada A4* satis- 
face la relación (19) del p. 24.3: 


B'=G"1AG, 


donde G es la matriz de Gram y A es la matriz de la aplicación 4. 
De aquí se ve que los divisores elementales de la matriz B coin- 
ciden con los divisores elementales de la matriz A. Sin embargo, 
de la condición de antisimetría se deduce que B=-— A; por con- 
siguiente, cambiando el signo de a en cada uno de los divisores ele- 
mentales (A—a)” de la aplicación 4, obtendremos de nuevo unos 
divisores elementales de la aplicación 4 que es lo que se quería 
demostrar. 


Ejemplos y problemas 


1. Sca YU una aplicación de un espacio bilimeal métrico no degenerado £ 
sobre sí mismo que conserva el producto escalar (aU, bU) =(a, b). Dernuéstrese 
que “U es una aplicación lineal y, por consiguiente, Jisométrica del espacio £. 

2. Los determinantes de las aplicaciones isométricas de los espacios bili- 
neales métricos no degenerados corrientes son iguales a + 1 de determinantes 
de las aplicaciones isométricas de los espacios bilineales métricos no degenerados 
hermitianos son de módulo igual a la unidad. 

3. En todo espacio bilineal métrico no degenerado £ existe una aplicación 
lineal Ff' que satisface la condición (x, y) =(yFf. x) si L es un espacio corrien- 
te, y la condición (x, y)=(ySF, x), si L es un espacio hermitiano. Demués- 
trese que la aplicación ¿f es isométrica y que su matriz es igual a 0'G-* o 
G'G-1 según sea £ un espacio corriente o hermitiano (G es una matriz de Gram 
del espacio £). 

4. Si en un espacio bilineal métrico no degenerado corriente Ú coinciden 
las aplicaciones conjfugadas a la derecha y a la izquierda de cualqpuier aplica- 
ción lineal, la métrica del espacio Y es simétrica o antisimétrica. 
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En el parágrafo presente y en Jos dos que le siguen examina- 
remos más detalladamente las formas elementales a las que pueden 
ser reducidas las matrices de las aplicaciones simétricas, antisimé- 
tricas e isométricas de los espacios euclídeos, simpliciales y seudo- 
unitarios sobre el cuerpo de los números complejos; estos últimos 
han sido clasificados de un modo completo al final del p. 24.2. 
Notemos que se traturá de determinar las formas elementales de las 
matrices de las aplicaciones en unos sistemas especiales de coorde- 
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nadas con la matriz de Gram bien definida, ya que sólo en esta 
condición se conocen, salvo un isomorfismo, las aplicaciones. En 
el caso de los espacios euclídeos unitarios y reales este problema 
ha sido resuelto en el cap. V. Para el sistema especial de coorde- 
nadas ha sido escogido en aquella ocasión un sistema ortonormal 
de coordenadas en el que la matriz de Gram es la matriz unidad. 
En el caso de espacios de tipo más complejo es preferible tomar 
para los sistemas principales o normales de coordenadas sistemas 
de coordenadas con una matriz de Gram de estructura más com- 
pleja. Comenzaremos por el estudio de un espacio euclíideo complejo. 


26.1. Aplicaciones simétricas. Como ya hemos señalado, se llama 


espacio euclídeo complejo un espacio no degenerado sobre el cuerpo 
de los números complejos provisto de una métrica simétrica corrien- 
te. La matriz de Gram de un espacio euclídeo complejo es regu- 
lar y simétrica. Recíprocamente, todo espacio bilinmeal métrico 
complejo con la matriz de Gram regular simétrica es un espacio 
euclídeo complejo. Pero todos los espacios euclídeos complejos de 
una dimensión n dada son isomorfos y por esto en todo espacio de 
esta índole existe un sistema de coordenadas con una matriz de 
Gram simétrica regular cualquiera dada de antemano. En particular, 
en todo espacio euclídeo complejo Y existe un sistema de coorde- 
nadas a,, A,, ..., A, en el que la matriz de Gram es de la forma 


da Fri (1) 


Convendremos en llamar normal todo sistema de coordenadas que 
tenga esta matriz. Los vectores de un sistema normal de coordena- 
das satisfacen las relaciones 


(2) Aur pl, (8, 0)=0 e 
(+kEn+!; Í, E=l, ..., n), 


que también son suficientes para que un sistema sea normal. 

La conveniencia de las bases normales se determina por la si- 
guiente propiedad de las mismas: toda aplicación lineal, cuya ma- 
triz en una base normal es una célula de Jordan, es simétrica. 

Efectivamente, por lo visto en el p. 24.3, una aplicación 4 es 
simétrica si es simétrica la matriz AG, donde G es la matriz de 
Gram de la base y A es la matriz de la aplicación 4 en esta base. 
Pero realizando directamente los cálculos se puede ver que al mul- 
tiplicar una célula de Jordan de orden n por la matriz G se obtiene 
una matriz simétrica. 

Esta observación permite demostrar inmediatamente el siguiente 
teorema principal: 
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TEOREMA 1. Sea dado un sistema arbitrario de expresiones de tipo 
(A—P,Y",..., (A—P,Y"". En todo espacto euclideo complejo de dimen- 
sión n=m,+...+m, existe entonces necesariamente una aplicación 
simétrica A para la cual las expresiones señaladas constituyen el sis- 
tema completo de sus divisores elementales. 

En efecto, pongamos 


0...01 pe! ' 
En 
ap 0 10 y Aj= As 4 (3) 
1...00 P) 
h, L Pp, 


donde los órdenes de las matrices G, y A, son iguales a m, 
(¡=1, a s). Sea 


G=6,+...+6, y A=A,+...+A, (4) 


En un espacio euclídeo complejo Y de dimensión n existe una base 
de matriz de Gram igual a G. Indiquemos por «4 la aplicación 
lineal de matriz A en la base señalada. Debido a la observación 
hecha anteriormente, la matriz AG es simétrica y con ella es si- 
métrica también la aplicación 4. Al mismo tiempo de (3) y de (4) 
se ve que 4 tiene el conjunto requerido de divisores elementales. 

En virtud del teorema 1 del p.25.1, el teorema demostrado 
resuelve completamente el problema sobre la clasificación, salvo un 
isomorfismo, de todas las aplicaciones simétricas de: un espacio 
euclideo complejo. En particular, de él se desprende el teorema 
siguiente: 

TEOREMA 2. Sea 4 una aplicación simétrica de un espacio euclideo 
complejo Y. Entonces, £ se puede descomponer en una suma directa 
de subespacios recíprocamente ortogonales invariantes respecto de A y 
tales qué en cada uno de ellos existe una base normal en la que la 
matriz de la aplicación inducida por la aplicación « será una célu- 
la de Jordan. 

Para la demostración indiquemos por (A—p,)"", ..., (A—p,)" 
el conjunto de tos divisores elementales de la aplicación 4. Tome- 
mos en £ una base a,, ..., a, tal que su matriz de Gram sea 
igual a la matriz G de (4), y sea 3 la aplicación lineal de matriz A 
de (4) en la base a,, ..., a,. Las aplicaciones 4 y HB son simé- 
tricas y semejantes. En virtud del mencionado teorema 1d del 
p. 25.1, de aquí se deduce que existe una aplicación isométrica Y 
tal que 4=UBU”"*. Entonces, la matriz de la aplicación 4 en la 
base a, U, ..., a,U coincidirá con la matriz de la aplicación B en 
la base a,, ..., €,, es decir, coincidirá con la mat.iz A. Al mismo 
tiempo, la matriz de Gram de la base a,U, ..., a,U es G y para 
la aplicación 3 las afirmaciones del teorema 2 sos evidentes. 
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En una base ortonormal la matriz de una aplicación simétrica 
es simétrica. Por ello, del teorema 1 se deduce que existen matrices 
complejas simétricas de cualquier conjunto de divisores elementales. 


26.2 Aplicaciones antisimétricas. Sea 4 una aplicación antisi- 


métrica de un espacio euclídeo complejo Y. Descompongamos Y en 
la suma directa de los subespacios radicales 


L=2 ++... blo 


Agrupando los sumandos que corresponden a pares opuestos de valores 
propios, obtenemos una nueva descomposición de *: 


L=MWÍIMN A.M, 


donde Mi, es el subespacio radical correspondiente a la raíz cero 
y Viyli=1, ..., £) son sumas de tipo 2,+2.,. El teorema 7 del 
p.25.2 muestra que los subespacios Mi,, ..., Di, son reciprocamente 
ortogonales y, además, son invariantes respecto de 4. Por esto el 
estudio del comportamiento de 4 sobre € se reduce al estudio del 
comportamiento de esta aplicación sobre los espacios Vi,, Mt,, ..., Mi, 

r separado. Consideremos más detalladamente el subespacio VI. 
upongamos que Mi, es diferente de cero e indiquemos por 4, la 
aplicación inducida en Vi, por ta aplicación .4. Puesto que todos 
los valores propios de la aplicación 4, son iguales a cero, se tiene 
A%=6, donde p es la dimensión de Vt,. Indiquemos por m la me- 
nor potencia de la aplicación 4, que se convierte en cero: 43 =6 
y APT 306. Consideremos dos casos: el de m par y el de mm impar. 
Sea m par; entonces m—i es impar y la aplicación 477! es anti- 
simétrica. La función bilineal (x.477*, y) es también antisimétrica. 
Puesto que esta función es diferente de cero, en Mi, existe un par 
de vectores a y b para el cual 


(adgal, b)=1. 
De la antisimetria de la aplicación .f, se desprende que 
(0AB, DAL) =— (0AE7%, LAGO) ==. (— 1) (a, dAL*). 
En particular, se tiene (a, 6.4771) =(— 13%! (a4xG"!, b)=—I, es 
decir b4G"* 0. Pongamos 
q4,=40, %Q =4 ho, ...p Can = An -1MHLo» 
b,=b, bi=b Ap .-.» 0. =U0m5- Ao. 
Las relaciones 
(2, Caria) =(— 147" (a,, a tg”) =0, (Os, Om+1-=4) =0, 
(Ar, Omer) =(— 197", (ag, bj) =0 
(R+j>me+l; k,j=l, ..., m) 
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muestran que la matriz de Gram de esta base es de la forma 
e do 0*...—] 


0 O 1 0 
ses "HE 
a 


donde en cada una de las cuatro células todos los elementos que 
figuran debajo de la diagonal secundaria son iguales a cero. El 
determinante de tal matriz es igual a +1 y, por consiguiente, el 


subespacio %*, tendido sobre los vectores a,, ..., Ga, D,, ..., Un es 
no degenerado. Debido al teorema 2 del p. 24.2, se tiene 
MT, => NIN, 


siendo Ni? de nuevo un subespacio invariante respecto de Ko. 

Consideremos el caso en que m es impar. La aplicación 47 es 
ahora simétrica y, por consiguiente, es simétrica su correspondiente 
función bilineal (x47=", y). Puesto que esta función no es igual 
idénticamente a cero, existe un vector a tal que (a47, a) 350. 
Pongamos 


a,=4, €a4>GA 0, --) Cn > Gn -1Ao- 
El subespacio N, tendido sobre los vectores a,, ..., a, es invarian- 


te respecto de 4,. Su matriz de Gram en el sistema de coorde- 
nadas a,, ..., a, es de la forma 


(A, 4) ... (€, Gp-1) (01, Gm) 
(A, 1) ... (Ay, Og-1) 0 


G= 


Efectivamente, 
(2), 04) =(aA_Ab7, 047) =(— A (aa, a)=0 
para [¡+r >m-+l. Además 
(A,, 42) =— (ls, 02-12 +... =(47, 4,)=0 30, 


De aquí se ve que la matriz G es regular; por consiguiente, el 
subespacio Y, es no degenerado y tenemos de nuevo 


M,=N,+N1É, 


donde NP es invariante respecto de A.. 

Es decir, hemos despejado de VW, un subespacio N, que en el 
primer caso representa una suma de dos subespacios de dimensión 
par y en el segundo caso es un subespacio de dimensión impar. 
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Aplicando este mismo procedimiento al subespacio complementario 
Ni podremos descomponerlo de nuevo en una suma directa de sub- 
espacios invariantes, etc. El espacio Mi, resultará descompuesto 
de esta forma en una suma directa de subespacios invariantes, cada 
uno de los cuales será o bien una suma directa de dos stubespacios 
de dimensión par o bien un subespacio de dimensión impar. En esta 
descomposición a todo subespacio corresponde un divisor elemental 
de la aplicación 4, de forma A”, donde p es la dimensión del 
subespacio. Por consiguiente, toda aplicación anfisimétrica de un 
espacio euclídeo complejo contiene un número par de veces a todo 
divisor elemental de tipo WM, Este resultado, así como el teorema 
7 del p. 25.2, imponen ciertas condiciones al sistema de divisores 
elementales de una aplicación antisimétrica. Demostremos que estas 
condiciones son suficientes para la existencia de una aplicación 
antisimétrica. 

TEOREMA 3. Las aplicaciones antisimétricas de los espacios eucli- 
deos complejos contienen los divisores elementales correspondientes a los 
valores propios no nulos en forma de pares (A— a)", (14 a)”, los 
divisores elementales de tipo AP también en forma de pares W”, AP para 
p par y los divisores elementales de tipo AP para p impar en com- 
binaciones arbitrarias. Reciprocamente, todo conjunto formado por un 
número fintto de expresiones de tipo (A—a;,y”: que cumple estas con- 
diciones, es un sistema de divisores elementales de tuna aplicación 
antisimétrica de un espacio euclideo complejo de dimensión adecuada. 

La primera parte de esta proposición ha sido ya demostrada. 
Por ello, para obtener la demostración completa del teorema debe- 
mos construir para cualquier sistema de expresiones, que cumple 
las condiciones del teorema, la correspondiente aplicación antisimé- 
trica. Por et de con el punto anterior esto se puede lograr del 
modo siguiente. Á todo par de expresiones (A—-a,)”, (A4-2,)11 y entre 
ellos a los pares con «,=0 ponemos en correspondencia las matrices 


B 0) 
a=[p,30] y a=[(0 8). 


donde D, es una matriz simétrica normal de tipo (1) del p. 26.1 
y B,es la célula de Jordan de orden sr, y con el valor propio a,. 
Si entre las expresiones dadas figuran expresiones A2s-! que no 
forman pares, les ponemos en correspondencia las matrices 


01 00... 3 
0... 01 0O!i0... 
0...10 01... 
G=sl 2... y 4sf... 
1 ...00 0 —1 
0 


20—1843 
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de orden 2s,— 1. Sea 
G=G,+... +6, y A=4,+...+4,. (5) 


Indiguemos por Y un espacio complejo de matriz de Gram igual a G. 
Puesto que G es una matriz simétrica regular, el espacio Y es 
un espacio complejo euclideo. Consideremos la aplicación lineal 4 
del espacio *, cuya matriz es A. La función bilineal correspondien- 
te a la aplicación 4 tiene la matriz AG con la particularidad 
de que 
AG=A,G,+...+456,. 


Los cálculos directos muestran que las células A,G,, y por ello 
también la matriz AG, son antisimétricas. Por esto la función 
bilineal y la aplicación 4 son también antisimétricas. Se ve, de 
la forma de la matriz A, que los divisores elementales de la apli- 
cación y tienen los valores requeridos. 

Según el teorema | del p. 25.1, todas las aplicaciones antisimé- 
tricas de un espacio euclídeo complejo que tengan sistemas iguales 
de divisores elementales son isomorías. Luego, del teorema 3 se de- 
duce que para toda aplicación antisimétrica 4 de un espacio 
euclídeo complejo Y existe un sistema de coordenadas en el que la 
matriz de Gram G y la matriz A de la aplicación son de la 
forma (5). 


26.3. Aplicaciones ortogonales complejas. Las aplicaciones iso» 


métricas de un espacio euclíideo complejo £ suelen llamarse aplica- 
ciones ortogonales complejas. Si en Y se ha tomado un sistema de 
coordenadas de matriz de Gram G, las matrices U' de las'aplicacio- 
nes ortogonales, y sólo estas matrices, satisfacen la relación 


UGU' =6. (6) 


En particular, si el sistema de coordenadas es ortonormal, se tiene 
G=E y (6) se convierte en 


UU" =E. 


En otras palabras, en un sistema ortonormal de coordenadas las ma- 
trices de las aplicaciones ortogonales son ortogonales. 

Las aplicaciones ortogonales con los divisores elementales iguales 
son, según el teorema 1 del p. 25.1, isomorfas. Por esto para la 
clasificación de las aplicaciones ortogonales es suficiente indicar qué 
sistemas de expresiones de tipo (A—«a;)” pueden servir como sls- 
temas de divisores elementales de las aplicaciones ortogonales. El 
esquema de la solución de este problema es el siguiente: conocemos 
los divisores elementales de las aplicaciones antisimétricas; las apli- 
caciones ortogonales se pueden expresar en términos de las antisi- 
métricas mediante las fórmulas de Cayley (p. 25.2); por consiguiente, 
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empleando el teorema sobre los divisores elementales de las funciones 
matriciales (p. Il: podemos encontrar también los divisores ele- 
mentales de las aplicaciones ortogonales. Sin embargo, al realizar 
este esquema debe tenerse en cuenta la existencia de los valores 
excepcionales en las fórmulas de Cayley, debido a lo cual la solu- 
ción adquiere la forma siguiente, algo más voluminosa. 

Sea U una aplicación ortogonal de un espacio euclídeo complejo Y. 
Representando Y en la íorma de la suma directa de los subespacios 
radicales de la aplicación YU y agrupando los subespacios correspon- 
dientes a valores propios reciprocamente inversos, obtendremos la 
descomposición 


LM. MM +... 4D, 


donde todos los VW, son recíprocamente ortogonales y, además, M_, 
y M, son los subespacios radicales de la aplicación YU correspon- 
dientes a los valores propios — | y +1. La aplicación U induce 
en cada uno de los subespacios 5 una aplicación ortogonal Y, 
y Jos divisores elementales de la aplicación “U se descomponen en 
los sistemas de divisores elementales de estas aplicaciones inducidas. 
Consideremos la aplicación U,. Todos sus valores propios son igua- 
les a +1.. La iórmula de Cayley 


A, = (6 —U,) ($ + Uy)”* 


transforma “Y, en una aplicación antisimétrica 4,. Representemos 
esta fórmula en la forma 4,=f(U,), donde f(A) =(l —A) (1 +4)7!. 
Puesto que la derivada de f(A) no se anula para A4=1, resulta 
(p. 16.4) que introduciendo en todo divisor elemental (A—a)” de la 
aplicación YU, en lugar de a el número (1—a)(1 +a)”!, obtendre- 
mos los divisores elementales de la aplicación .4,. Pero los divisores 
elementales de la aplicación U, son de la forma (A— 1)*; por consiguien- 
te, los divisores elementales de la aplicación 4, son de tipo 45, Si s es un 
número par, las aplicaciones antisimétricas contienen todo divisor 
elermental de tipo A* un número par de veces y por esto la aplica- 
ción U, contiene todo divisor elemental de tipo (A—1)* también 
un número par de veces, si s es par. 
Aplicando la fórmula de Cayley 


A=($ + U ($ — Uy" 


a la aplicación U.,, obtendremos, de forma análoga, que la aplica- 
ción U contiene todo divisor elemental de tipo (4 + 1)* también un 
número par de veces, si s es par. 

TEOREMA 4. Los divisores elementales de las aplicaciones ortogonales 
complejas correspondientes a los valores propios diferentes de + 1 
aparecen en pares de tipo (1—«a)”, (A—a”!)”; los divisores elemen- 
tales de tipo (A+ 1)** aparecen un número par de veces y los divi- 
sores elementales de tipo (A + 1)*+* aparecen en combinaciones arbi- 


20* 
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trarias. Reclprocamente, todo sistema de expresiones de tipo (A—au«¡)" 
(a, +0) que cumple estas condiciones es un sistema de divisores 
elementales de una aplicación ortogonal compleja. 

La primera parte del teorema ha sido ya demostrada. Suponga- 
mos, por ello, que tenemos un sistema de divisores elementales de 
tipo (A—a,)"(a, +0) que satisíace las condiciones del teorema. 
Separamos en este sistema los divisores elementales de tipo (A + 1)” 
y para cada uno de los divisores elementales (A—a,)"i que quedan 
construimos la expresión (A—P;)”t, donde P,=(1—a/,) (1 +0/)7?. 
El sistema de las expresiones (A—P,)": cumplirá las condiciones 
del teorema 3 y, por consiguiente, será un sistema de divisores 
elementales de una aplicación antisimétrica 4, de un espacio euclídeo 
complejo %,. Puesto que hernos tomado solamente valores de «, dife- 
rentes de —J, todos los f, serán también diferentes de —1. Em- 
pleando para «4, la aplicación de Cayley, cotenemos una aplicación 
ortogonal UU, con los divisores elementales (A— a)" (a; 34 — 1). 
Análogamente, para todo divisor elemental de tipo (A + 1)”: tomamos 
la expresión A” y buscamos una aplicación antisimétrica 4, de un 
espacio *,, cuyos divisores elementales sean A”, Entonces la 


aplicación 
YU, a ($ —4A,) ($ + Ay)"* 


será una aplicación ortogonal del espacio *,, cuyos divisores ele- 
mentales son (A+ 1)", Tomemos en Y, y en 2, unos sistemas orto- 
normales de coordenadas e indiquemos por U y U, las matrices 
de las aplicaciones U, y U,. Estas matrices serán ortogonales y por 
ello la suma directa U,4+U,=U de las mismas también será una 
matriz ortogonal. 

Los divisores elementales de la matriz U tendrán, con arreglo 
a la construcción, los valores requeridos y el teorema queda 
demostrado. 


Ejemplos y problemas 


l. Constráyasc una matriz ortogonal de divisores elementales (A— 1)3, 
(A—1)2, hy y h—2. 
2. Demuéstrese que las matrices de lipo 14 +B, donde A es una matriz 


simétrica regular y B es una matriz antisimétrica, contienen un número par de 
veces todo divisor elemental de tipo 422, 


3. Empleando el teorema 2, redúzcase a la forma elemental el siguiente 
par de formas cuadráticas 


251 + 283 + 25159 + 2:25, — Lis —LEsha 
El + 351 4283 + 25155 — 4EnEa + 2595, — Lg Es. 


Respuesta: 2 (EjEr HE 5) y +2 +E- 
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4. Constrúyase una matriz compleja antisimétrica de divisores elementales 
A—23% M+9% 42, 22 y 42. 

5. ria EN una matriz compleja simétrica de divisores elementales 
(A —2), 13 y 45. 


$ 27. Espacios simpliciales 


27.1. Aplicaciones simétricas. Se llaman espacios simpliciales, 
, según el p. 24.2, los espacios bilineales métricos provistos de una 
métrica antisimétrica no degenerada. La dimensión de un espacio 
simplicial es un número par. Puesto que todos los espacios simpli- 
ciales de una dimensión dada son reciprocamente isomorfos, en todo 
espacio simplicial de dimensión n =2m existe una base, cuya mat- 
riz de Gram es igual a cualquier matriz antisimétrica regular de 
orden n dada de antemano. En particular, en todo espacio simpli- 
cial existen sistemas de coordenadas, en los cuales la matriz de 
Gram es de la forma 


[ee RL 


Estos sistemas se llamarán simpliciales. Análogamente, en Y existen 
sistemas de coordenadas, en los cuales la matriz de Gram es de 


la forma 
=[_26) 


donde E es una matriz unidad y O es una matriz nula. Convencre- 
mos en llamar estos sistemas normales. Ea lo que sigue considera- 
remos solamente espacios simpliciales complejos. 

Sea ahora 4 una aplicación simétrica de £, Descompongamos £ 
en la suma directa 


2 =%, +2Lo, + ds +%,, 


donde P,, Ps, ---» Ps son los diferentes valores propios de la apli- 
cación 4 y %p,, ..., Yo, son los correspondientes subespacios radi- 
cales. Los subespacios *o, son, según el p. 25.2, reciprocamente 
ortogonales. Debido a que el espacio Y es no degenerado, los subes- 
pacios *,, .-., Lp, también son no degenerados y por consiguiente, 
simpliciales. Tomemos uno de ellos, digamos Y,,, e indiquémoslo 
por M. Sea 4, la aplicación inducida en M por la aplicación .z. 
Pongamos, además, 4,—p¡6$ = 3. Puesto que 4, y $ son aplica- 
ciones simétricas, 3 es también una aplicación simétrica. Todos 
los valores propios de la aplicación A, son iguales a p,; luego, 
indicando por p la dimensión del espacio Wi obtenemos 


(Ap /6)” > HP=0. 
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Sea m el exponente menor para el cual 3*=6. La expresión 
(xB”"1, y) es una Íunción bilineal antisimétrica en x e y correspon- 
diente a la aplicación B*7*, Puesto que 3”*"!X<6, la función 
(x3”-*, y) no puede ser igual idénticamente a cero y, por consi- 
guiente, en M existe un par de vectores a y 6 tal que (aB”*7!, b)=1. 
Pongamos 
aB/=4j+, y BB! =Dbj4, (i¡=0, Ll ...y m— 1). 
Debido a la simetría de 3, tenemos 
(4), 44) =(4B/"*, aB*1)=(938/+*-2, a) = (a, aB/+*-?), 
Sin embargo, el espacio £ es antisimétrico y por esto 
(aB/+*-=%, a) =— (a, aB!+*-32), 


Comparando esta fórmula con la anterior, vemos que 


(a, ap) =0 (1, 41, 2, ..., m). (2) 
Análogamente se obtienen también las relaciones 
(bj, 6,)=0 (i, k=1, 2, ..., m). (3) 


Además, de las condiciones (aB*”*, b)==1 y B”=6 se deduce: 
(Uns Byr 1) == (ABU, Bb") =(aRB”-1, b) = (4, b,)=1 (4) 


(8, 01) =(94B/72, LbB1)=(48/+-32, b)=0 (¡+ >m+1). (5) 
Formando ahora la matriz de Gram de los vectores a,, ..., Gm, 
1» +» +, b,, veremos, en virtud de las relaciones de (2) a (5), que 
tiene la forma triangular con ceros sobre la segunda diagonal. 
Puesto que los elementos que se hallan en la propia segunda dia- 
gonal son iguales a+ 1, el determinante de esta matriz es diferente 
de cero. Por consiguiente, el subespacio Mi, tendido sobre los vecto- 
TOS (, .. y y es no degenerado. Indiquemos por De 
y M., los be pelos tendidos sobre los vectores a,, .. 

-.» Do, respectivamente. Debido a las relaciones (5), los 
subespacios MM. y Vi,, son de una misma dimensión y M, es la 
suma directa de los mismos. Puesto que Wi, es no degenerado, 
tenemos, en virtud del punto 24.2, 


M=M,+M. 
El subespacio Mi, es invariante respecto a B y por esto Mj tam- 


bién es invariante respecto a B. Procediendo ahora con Mi igual 


que con M, podemos ape en cg un subespacio Ml, que es 
una suma directa de dos su pacios M,, y M,,, etc. Después de 
un número finito de pasos obtendremos la descomposición directa 


TM =M, + M, + o» +M,, 
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donde cada uno de los subespacios M,, ..., Mi, será, a su vez, 
una suma directa de dos subespacios de una misma dimensión. 
A todo subespacio de dimensión m que figura en esta descomposi- 
ción le corresponde un divisor elemental (1—p,)” de la aplicación 4. 
Por consiguiente, llegamos a la conclusión de que en un espacio 
simplicial los divisores elementales de las aplicaciones simétricas 
aparecen en pares (A—p;)”, (A—p,)”. 

Demostremos ahora que, recíprocamente, para todo sistema de 
expresiones (A—p,)", (A—p,)" existe una aplicación simétrica de 
un espacio simplicial Y, cuyos divisores elementales son estas ex- 
presiones. 

A todo par (A—p,)", (A—p,)” ponemos en correspondencia el 


par de matrices E A 
E B, 
0-19] 1 4=l0'8). 


donde £,es la matriz unidad de orden m, y B, es la célula de 
Jordan de orden m, con el valor propio p, y sea 


G=G,+...+6, y A=A,+...+4As. (6) 


Consideremos un espacio bitineal métrico complejo £ de matriz de 
Gram G. Puesto que G es una matriz antisimétrica regular, el 
espacio £ es un espacio simplicial. Los cálculos directos muestran 
que : 

AG=A,6,+A,G,+... +45,6G, 


es una matriz antisimétrica. Por esto la aplicación lineal 4 del 
espacio £, cuya matriz es A, es simétrica. Al mismo tiempo, los 
divisores elementales de la aplicación 4 tienen los valores requeri- 
dos. Es decir, hemos obtenido el teorema siguiente: 

TEOREMA 1, Todo divisor elemental de una aplicación simétrica 
de un espacio simplicial aparece un número par de veces. Recíproca- 
mente, todo sistema de expresiones de tipo (A—p,)”+ que cumple esta 
condición es un sistema de divisores elementales de una aplicación 
simétrica de un espacio simplicial. 

Sabernos ya (p. 25.1) que las aplicaciones simétricas de los es- 
pacios simpliciales que tienen divisores elementales iguales son iso- 
morías. Por ello, el teorema 1 resuelve plenamente el problema de 
clasificación de las aplicaciones simétricas. En particular, muestra 
que para toda aplicación simétrica 4 de un espacio simplicial Y 
se puede escoger una base tal que la matriz de Gram G y la matriz A 
de la aplicación sean de la forma (6). 


27.2. Aplicaciones antisimétricas. Una aplicación lineal 4 de 


un espacio bilineal métrico € es antisimétrica, si (14, y) =— (x, yA) 
para todos los x e y de £. 
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En virtud del teorema 3 del p. 26.2, los divisores elementales 
de una aplicación antisimétrica 4 de un espacio simplicial Y, co- 
rrespondientes a los valores propios no nulos, aparecen en forma de 

ares de tipo (A—-p)”, (A +p)”. Probemos que los divisores elemen- 
ales de la aplicación 4 correspondientes al valor propio nulo, es 
decir, los que son de forma A”, también aparecen en forma de 
pares, 4%, A”, si m es impar. La demostración es completamente 
análoga a la demostración de la afirmación respectiva del p. 26.2 
y sólo indicaremos el esquema de la misma. 

Nos basamos en la representación de £ en la jorma de la suma 
directa de los subespacios radicales de la aplicación A. Agrupando 
en esta representación los subespacios correspondientes a los valores 
propios opuestos, obtendremos la descomposición 


2=M1M +... +, 


donde todos los subespacios M,, ..., M, son invariantes y recipro- 
camente ortogonales, siendo Mi, el subespacio radical correspondiente 
a la raíz nula. Sea 4, la ón del subespacio Wi, inducida 
en éste por la aplicación 4. Todos los valores propios de la apti- 
cación 4, son iguales a cero y, por ello, 45=6, donde p es la 
dimensión de Mi,. Indiquemos por m el menor exponente para el 
cual 47 =0. La aplicación 4, es antisimétrica y, por consiguiente, 
la aplicación 4—* será, igual que en el p. 26.2, simétrica para m 
impar y antisimétrica para m par. Sin embargo, la correspondiente 
función bilineal (x4F—*, y) será ahora simétrica para m par y an- 
tisimétrica para m impar, ya que la métrica de los espacios simpli- 
ciales es antisimétrica. Los razonamientos ulteriores del p. 26.2 se 
conservan con la única diferencia que se obtendrá ahora un par de 
espacios en el caso de m impar. 

TEOREMA 2. Los divisores elementales de las aplicaciones antisimé- 
tricas de los espacios simpliciales correspondientes a los valores pro- 
pios no nulos aparecen en forma de pares (A—p)”, (A+p)”; los 
divisores elementales de tipo NW” con m impar también aparecen en 
forma de pares A”, A” y los divisores elementales NW" con m par 
pueden aparecer en combinaciones arbitrarias. Reciprocamente, todo 
sistema de expresiones de tipo (A—p,)"' que posee estas propiedades 
es un sistema de divisores elementales de una aplicación antisimétrica 
de un espacio simplicial. 

Es preciso demostrar sólo la segunda parte de este teorema. Con 
este fin, a todo par de expresiones de tipo (A—p,)"!, (A+4-p,)", y 
en particular al par con p¿=0, ponemos en correspondencia el par 


de matrices 
0-(2,5)»4-[8 2) 


donde E, es la matriz unidad de orden m, y B, es la célula de 
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Jordan de orden m, y de valor propio p,. A las expresiones que 
quedan de tipo A” con m, par ponemos en correspondencia el par 
de matrices 


00 0 mM 010 00 
00 —10 0 1 00 
G;= .o. . o ro... a «0. o. y 4A,= .o .— +... . +... 0» 
01.. 00 01 
—10. 00 0 


G=G,+...+6, y A=A,+...+4As. 


Consideremos un espacio bilineal métrico complejo € de matriz de 
Gram igual a G. La matriz G es antisimétrica y regular y por 
esto el espacio £ es simplicial. La aplicación lineal 4 de matriz A 
tiene los divisores elementales dados. Al mismo tiempo, la aplica- 
ción 1 es antisimétrica, ya que tos cálculos directos muestran que 
la matriz 


AG=4,6,+4,G,+...+456, 
es simétrica. Hemos demostrado el teorema. 


27.3. Aplicaciones simpliciales. Las aplicaciones isométricas de 
un espacio ados £ suelen llamarse aplicaciones simpliciales de 
este espacio. Por consiguiente, si “YU es una aplicación simplicial 


del espacio £, se tiene (xU, yU)=(x, y) para todos los x e y de 2. 
En términos de matrices esta igualdad da 


(x] UGU” [y]" = [x] G [y]”, 


UQU' =G, (7) 


donde G es la matriz de Gram y U es la matriz de la aplicación U. 
Tomando en * un sistema simplicial de coordenadas, convertiremos 
la relación (7) en 

USU'=S, (8) 


donde S es una matriz simplicial de tipo (1). Las matrices Y que 
satisfacen la condición (8) serán llamadas matrices simpliciales. 
Por consiguiente, para que una aplicación lineal de un espacio 
simplicial sea simplicial es necesario y suficiente que su matriz 
sea simplicial en un sistema simplicial de coordenadas. De (8) 
también se desprende directamente que una suma directa de matri- 
ces simpliciales es una matriz simplicial. 

Sea U una aplicación simplicial arbitraria de un espacio simpli- 
cial Y. Representando € en la forma de la suma directa de los 
subespacios radicales de la aplicación U y agrupando después los 
sumandos correspondientes a los valores propios reciprocamente 


de donde resulta 
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inversos de la aplicación U, obtenemos la descomposición 
LM IAMEM) E, 


donde WMt_, y Mt, son los subespacios radicales correspondientes 
a los valores propios — 1 y +1. Los subespacios M._,, ..., M, 
son, en virtud del teorema Y del p. 25.2, reciprocamente ortogonales. 

El estudio del comportamiento de U sobre £ se reduce ahora 
al estudio del comportamiento de YU sobre cada uno de los subes- 
pacios Wi; por separado. Repitiendo los razonamientos del p. 26.3 
y empleando, en lugar del teorema sobre los divisores elementales 
de las aplicaciones antisimétricas de los espacios euclídeos comple- 
jos, el respectivo teorema para los espacios simpliciales, obtenemos 
a siguiente proposición: 

TEOREMA s. Los divisores elementales de las aplicaciones simplicia- 
les correspondientes a los valores propios diferentes de + 1 aparecen 
en forma de pares (A—p)”, (A—p”7 Y", los divisores elementales de 
tipo (A + 1)2*+!* también aparecen en forma de pares (A+ 1)39+*, 
(M4 1)99+1 0 (A—1)2+1, (A—1)"*1 y los divisores elementales de 
tipo (A+ 1)?” pueden aparecer un número arbitrario de veces. Reci- 
procamente, todo sistema de expresiones de tipo (A—p Y", p,>+0, que 
posee estas propiedades es un sistema de divisores elementales de. una 
aplicación simplicial. | 

Las aplicaciones simpliciales que tienen divisores elementales 
iguales son, en virtud del teorema 1 del p. 25.1, isomorfas. Por 
esto el teorema 3 ofrece una clasificación completa, salvo un iso- 
morfismo, de las aplicaciones simpliciales. Este teorema muestra, 
en particular, que si —1 es un valor propio de una aplicación 
simplicial, la multiplicidad de este valor propio es necesariamente 
par. Como todos los demás valores propios o bien son iguales a + 1 
o bien figuran en forma de pares recíprocamente inversos y de la 
misma multiplicidad, el producto de todos los valores propios de 
una aplicación simplicial es igual a +1”. Este producto es igual 
al determinante de la matriz de la aplicación y Megamos así a la 
conclusión de que los determinantes de las matrices de las aplica- 
ciones simpliciales son iguales a la unidad. 


Ejemplos y problemas 


ds AS una matriz' simplicial de divisores elementales 1+1, 4+ 1 
y (A—1). 
Á 


B r 
2. Demuéstrese que las matrices de tipo carl: donde B y C son ma- 


trices cuadradas antisimétricas de un mismo orden, contienen todo divisor ele- 
mental un número par de veces. 

3. Enúnclese el teorema | como el teorema de pares de formas bilineales 
antisimétricas. 


1) Todo valor proplo se cuenta tantas veces como indique su multiplicidad. 
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$ 28. Espacios seudounitarios 


En el p. 24.2 hemos llamado espacios seudounitarios los espa- 
cios bilineales métricos hermitianos sobre el cuerpo de los númieros 
complejos provistos de una métrica no degenerada y simétrica: 
(x, y)=(y, x). También hemos demostrado en esa ocasión que todos 
estos espacios se determinan, salvo un isomorfismo, por su dimen- 
sión n y su signatura s y que, para un valor dado de n, s puede 
tomar los valores n, n—2, ..., —n. Ál igual que antes, nos 
interesarán las propiedades de las aplicaciones simétricas, antisi- 
métricas e isométricas. La clasificación de estas aplicaciones en el 
caso de espacios euclídeos pate ME y de espacios simpliciales se 
basa en el teorema 1 del p. 25.1. En los espacios seudounitarios 
este teorema no tiene, en general, lugar. Consideremos, por ejemplo, 
un espacio bilineal métrico hermitiano de dos dimensiones £ de 
base e,, y €, y de matriz de Gram 5 Me 3 

Las aplicaciones lineales YU, y YU, definidas por las igualdades 


Í 
e U,=2e,, € U,= 7 tn 
] 
ey U, ==> la» eU, = 2e, 


serán, obviamente, aplicaciones isométricas de este espacio. Los 
divisores elementales de las aplicaciones U, y U, son los mismos, 
a saber, A—2 y >. Sin embargo, U, y YU, no son jsomorífas. 
En efecto, si las aplicaciones Y, y “U, fuesen isomorfas, los subes- 
pacios radicales correspondientes al valor propio 2 podrían ser 
transformados uno en el otro mediante un automorfismo del espa- 
cio £. El subespacio radical correspondiente al valor propio 2 de 
la aplicación U, es la recta ae, y el subespacio análogo de Ja 
aplicación UY, es la recta ae, Al mismo tiempo, todos los vectores 
no nulos de la primera recta tienen un cuadrado positivo y todos 
los vectores no nulos de la segunda recta tienen un cuadrado nega- 
tivo. Por consiguiente, ningún automorfismo del espacio Y puede 
transiormar la primera recta en la segunda que es lo que se quería 
demostrar. 

Este ejemplo muestra que la vía puramente geométrica para el 
estudio de las aplicaciones de los espacios seudounitarios resulta, 
en cierta medida, necesaria. 


28.1. Aplicaciones simétricas. Sea Y un espacio seudounitario 
de dimensión n de signatura s. Consideremos un subespacio 
lineal arbitrario N de £. Convendremos en decir que un sistema 
de coordenadas de N es normal positivo si su matriz de Gram es 
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de la forma 
DOs...0 1 
no DOSOGD ( 
1... 00 
y que es normal negativo si su matriz de Gram es de la forma 
r 0... 0—1 
Ml TS 0) 
L— | 0 0 


Es obvio que rio” todo subespacio admite un sistema normal de 
coordenadas. Esto. depende de la signatura del subespacio y de su 
dimensión. Los subespacios de dimensión par que admiten un 
sistema normal de coordenadas, positivo o negativo, son de signa- 
tura cero; los subespacios de dimensión impar con un sistema nor- 
mal positivo de coordenadas son de signatura 4-1 y los que poseen 
un sistema normal negativo de coordenadas son de signatura — 1. 
La demostración se deduce fácilmente de la definición de la si- 
gnatura (p. 24.2). 

Estudiemos los divisores elementales de una áplicación simé- 
trica 4 de un espacio seudounitario Y. Descompongamos £ en la 
suma directa de los subespacios radicales de la aplicación 4 y agru- 
pemos los sumandos que corresponden a los valores propios con- 
jugados. Así obtendremos la descomposición de Y en la suma 
directa de subespacios invariantes 


£=M,+M,+... +D). (3) 


Estos subespacios son, según el p. 25.2, recíprocamente ortogonales 
y por ello el estudio de la aplicación 4 se reduce al estudio 
de la aplicación 4 en cada uno de los Wi,. El espacio Y es no 
degenerado y por esto todos los Mi; son también no degenerados. 
Observemos ahora que los subespacios Wi, pueden ser de dos tipos: 
1) Mi, es la suma directa de dos subespacios radicales correspon- 
dientes a valores propios conjugados no reales' y 2) Mi; es el sub- 
espacio radical correspondiente a un valor propio real. Considere- 
mos el primer caso: sea 


M,=M, +M,, 


D Si a es un valor propio y a no es un valor propio, aceptaremos formal: 
mente que L- es el subespacio nulo. De los razonamientos ulteriores se deduce, 


sin embargo, que este caso no puede darse. 


$ 28. Espacios seudounitarios 317 


donde M, y Mi, son los subespacios radicales correspondientes a los 
valores propios a y «a, donde «=5£a. Razonando igual que en el 
p. 25.1, obtenemos 

(a,, a1)=0 y (a, a,)=0, (4) 
donde a; y a; son vectores cualesquiera de Wi; y a; y a, son vec: 
tores cualesquiera de M;. Si existe un vector a* de M, ortogonal 
a todos los vectores de M;, el vector a” es isótropo en M;. Como 
el subespacio WM, es no degenerado, esto da a'=0. Luego, para 
todo vector no nulo del subespacio M;/ existe un vector no orto- 
gonal del subespacio M?;. 

Hemos supuesto que M; es el subespacio radical de la aplica- 
ción 4 correspondiente a la raíz a. Por consiguiente, tenemos para 
un valor natural de m 

M¡(A—ag$)y=0 y Mit—ub y” 0. (5) 


Tomemos en M, un vector a tal que a(4—adSy"”* o. Puesto 
que a(4—ady”"* es diferente de cero, en Mi; existe un vector b 
no ortogonal a a(4—adSy””*. Normalicemos b de modo que 


(a(4—ady"*, b)=1. 


Pongamos ahora 
a(da—abY =40),, y bA—RG6Y/=b),,, 
(¡=0, 1, ..., m—1). 
Como la aplicación «4 es simétrica, resulta 
(A—a6Y =4—3É y (4—a6)" =(4—36). 
Por consiguiente, para ¡+k=m>+1 se tiene 
(4, dy) =(a(A—28)7*, b(A—U6)"*) = 


= (a(4—ag$)/'*-*, ba1 (6) 
y para j+4k>m-+l se tiene 
(a, 6) =(a (4 —a6)+*-*, b)=0, (7) 


En «particular, de (6) se deduce que b(4—1a$)""* 650. Además, si 
a' pertenece a M;, tenernos 


(7, LA—26)Y") =(a (4—aby”, b) =0. 
En otras palabras el vector b(4-—aS$)” del subespacio DI; es orto- 
gonal a todos los vectores de Wi; En virtud de la observación 
hecha, esto da b(4— agy" =0. Indiquemos por N, y M; los subes- 


pacios tendidos sobre los vectores 4,, Az, -.., Op Y bj Do ..., Om, 
respectivamente. 
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(,=40, +0, 0,+--- + ml» 


Cy SC /(A—0b) (¡=1, ..., m—1). 
De las fórmulas (6) y (7) se deduce que para cualesquiera valores 
de %,, ..., %, se tiene (c,(4-—agSy”"*, b,)=1, de donde ottene- 
mos de nuevo 
(Cy, Ems => 1 E (Cy, by) =0 (8) 
G+rk>m+l; ,k=1,...,m). 
Es fácil ver que los coeficientes %,, ..., %, se pueden escoger de 
manera que se cumplar las condiciones complenentaríias 
(Co Om) = (31 m1) =--- =(€p b,) =0. 
Entonces para ¡+k<m-+1 tenuremos 
(E), bx) =(C,, b, (4—a6)/+? Y =(C,, 0/+4-1) =0. (9) 
Sea N, =-N,+9M;,. Las relaciones (4) (8) y (9) muestran que el 
sistema €, ..., Car BD, --.» 0, es un sistema normal positivo de 


coordenadas en N,. Al mismo tiempo, la matriz de la aplicación 4 
en este sistema de coordenadas se descompone en un par de células 
de Jordan de divisores elementales (A——a)” y (A—2)”. 

El subespacio NH, es no degenerado; por consiguiente, 


M,=M, +R, 
donde N?2 es de nuevo un subespacio invariante respecto: a 4. Si 
Ni o, podemos, aplicando a N el proceso expuesto, despejar en 


él un subespacio invariante R,, etc. Así obtendremos para WM, una 
representación de la forma 


MN, +48, +...+M,,, 


donde R,, ..., N,, son subespacios invariantes recíprocamente orto- 
gonaljes y en cada uno de ellos existe un sisterna mormal positivo 
de coordenadas en el que la matriz de la aplicación 4 se descom- 
pone en dos células de Jordan de divisores elementales (A—ay” y 
(A— 2)”. y 

lid el segundo caso. Sea Wi, el subespacio radical co- 
rrespondiente a un valor propio real «. Buscamos de nuevo un número 
natural m tal que 


M,(4—a2a6 Y” =0 y VE(A—aS Y” 40. 
Puesto que (4—ag) =A—U8S =4A—aé8, la aplicación 4—ad$ 
y con ella, también la aplicación (4—aS)”"* son simétricas, 
a correspondiente función bilineal hermitiana (x(4—ady”"*, y) 
es también simétrica y no se anula idénticamente sobre Mi,. Por 
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esto en Mi, existe un vector a tal que 
(a(4—a6)""2, a) =P 0. (10) 
De la simetría de la función se deduce que f es real. Tomando 
a,=V]|B])"* a, obtendremos en lugar de (10) la relación 
(a, (4—ad$)”"", a,)=8, e=-xl. (11) 
En esta relación el signo de la unidad depende de las propiedades 


de la misma aplicación 4 y, en todo caso, no lo podemos cambiar 
mediante la normalización. Pongamos 


Qj41=4 /(A—ab) (j=1, ..., m—1). 
De (11) resulta: 

(2), Ansi) =(0, (A—aSyY”"*, 4,) e. (12) 
Análogamente, de la condición M, (4—u$)” =0 obtenemos 
as (2), 44) =(8,(A—agy**"*, a)=0 (+k>m-+1). (13) 

j b,=0,+00+... +0 la, 

donde %,, ..., %, son, por ahora, unos números arbitrarios. Pongamos 

bj =b/(A—08) (i=1, ..., m—1). (14) 
De las igualdades (12) y (13) resulta: 

(Oy Bm+1-¡)=8 y (0, 61) =0 
U+R>m+L 1 k=1,..., m). 


Es fácil ver que los números %,, ..., 4%, se pueden escoger de modo 
que se cumplan las relaciones 


(01, Om-1) =(01, B7.1)=+».. =(0,, 6,)=0. 
Entonces para ¡+4 <m-+1 tendremos 
(Op E) =(0,, db, (A—a6)/***=1(b,, bj,y.1) =0. (16) 


Consideremos el subespacio YN, tendido sobre b,, ...,6,. De (14) 
se deduce que M, es invariante respecto a 4 y que la matriz de 
la aplicación 4 en este sistema de coordenadas es igual a una célula 
de Jordan de divisor elemental (A—a)”. Por otra parte, de (15) 
y (16) se ve que b,, ..., b,, es un sistema normal de coordenadas 
en N, y, además, positivo, si e== +1, y negativo, si e=— 1. El 
espacio ñ es no degenerado y, por ello, siendo N, ++ o, se tiene 


M,=R,+N1, 
donde Ni es un subespacio invariante de menor dimensión. Apli- 
cando a Ri el mismo proceso, despejaremos de MÍ un subespacio 


(15) 
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invariante M,, etc., hasta obtener la descomposición de M, en una 
suma directa de espacios recíprocamente ortogonales. 

Aplicando ahora nuestros resultados a cada uno de los subespacios 
M,, representaremos el espacio Y en la forma 


L=P.+B,+...+B, (17) 
donde B,, ..., PB, son subespacios recíprocamente ortogonales, cada 
uno de los cuales corresponde o bien a un divisor elemental real 
(A—a)” de la aplicación .4 o bien es la suma directa de dos 
subespacios correspondientes a divisores elementales conjugados 
(A—a)” y (A—a)”; además, en los subespacios del primer tipo 
existen sistemas normales, positivos o negativos, de coordenadas en 
los que la matriz de la aplicación 4 será una célula de Jordan, 
mientras que en los subespacios del segundo tipo existen sistemas 
normales positivos de coordenadas en los que la matriz de la aplicación 
4! será la suma directa de dos células conjugadas de Jordan. 

A todo subespacio P,, correspondiente a una raíz real «u, le 
corresponde un divisor elemental (A—a)” de la aplicación 4. Con- 
vengamos en poner en correspondencia al subespacio P, el divisor 
elemental + (A—a)”, si en PB, existe un sistema normal positivo 
de coordenadas, en el que la matriz de la aplicación 4 tiene la 
forma de una célula de Jordan, y el divisor elemental — (A—a)”, 
si en Y, existe un sistema normal negativo de coordenadas con ta 

ropiedad señalada. Mediante esta regla podemos, basándonos en 
a descomposición (17), obtener un sistema de divisores elementales 
de la aplicación .¿ en el que todo divisor elemental real tendrá un 
signo determinado. Un sistema de divisores elementales de este tipo 
convendremos en denominarlo de signo definido. Repitiendo los 
razonamientos, realizados al final del p. 26.1, obtenemos que son 
isomorfas las aplicaciones simétricas del espacio £ que tienen unos 
sistemas de divisores elementales de signo definido iguales. 

Supongamos ahora que tenemos dado un sistema arbitrario de 
expresiones de tipo +(A—aj;)”:, en el que todas las expresiones 
no reales aparecen en forma de pares conjugados y llevan el signo 
«nás». ¿Existen un espacio seudounitario Y y una aplicación simé- 
trica 4 del mismo tales que el sistema dado Y (A—a;)”: sea un 
sistema de divisores elementales de signo definido de la aplicación 4? 
La E es, obviamente, afirmativa. La construcción del es- 
pacio Y y de la aplicación 4 se puede realizar siguiendo el mismo 
método que ha sido empleado en el p. 26.1. Puesto que para esta 
esterrucción no se necesita nada nuevo, la dejamos a cargo del 
ector. 

Queda por demostrar un resultado más sútil de que el sisterna 
de divisores elementales de signo definido de una aplicación 4 no 
depende de cómo se escoja la descomposición (17) y se determina 
totalmente por la propia aplicación. 
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La descomposición (17) ha sido obtenida como resultado de la 
división de Jos subespacios M,, ..., M, en subespacios cíclicos P,. 
Puesto que los propios subespacios Mt, son o bien radicales o bien 
una suma de subespacios radicales, y, por consiguiente, se deter- 
minan univocamente, la no unicidad puede surgir solamente al 
descomponer cada uno de los subespacios M,. Los subespacios WM, 
que son unas sumas de dos subespacios radicales no tienen interés 
para nosotros, ya que al descomponerlos se obtienen pares de subes- 
pacios cíclicos con pares de divisores elementales conjugados de tipo 
A—ay” y (A—ay”. Luego, resta demostrar solamente que como 
quiera que se descomponga un subespacio radical M, con raíz real a 
en una suma de subespacios no descomponibles y recíprocamente 
ortogonales, el sistema de divisores elementales de signo definido 
+ (A—a)” será el mismo. 


Sean 
M=R,+4N +... +N, (18) 
M¡=B,+PB, +... +8, (19) 


dos descomposiciones de M, en sumas ortogonales de subespacios no 
descomponibles. Indiquemos por $, (A— a)” y e, (A — a)”: los divisores 
elementales de signo definido correspondientes a los subespacios M, 
y P;, respectivamente (¿=1, ..., t; 6,, e; ==+1). Coloquemos los 
sumandos de las sumas (18) y (19) de modo quem, >m, >... >m,, 
Supongamos que tenemos varios sumandos de dimensión mayor: 


mMm,=... =Ma > Mz, Demostremos entonces que los sistemas de 
divisores elementales mayores €,(A—a)y", ..., e.(1A—a)j" y 
5, (A—ay", ..., 6, (A—a)"* están compuestos de los mismos tér- 


minos. Consideremos la función bilineal f, (x, y) =(x(4 —28)”*"*, y). 
La aplicación A—adS es simétrica y por esto la función f, (x, y) 
es también simétrica. Determinemos su signatura empleando la des- 
composición (18) y empleando la descomposición (19). Todos los 
subespacios de la descomposición (18) son ortogonales respecto a la 
función f, (x, y). Por ello la signatura de la función f, (x, y) sobre M, 
es igual a la suma de sus signaturas calculadas por separado sobre 
cada uno de los sumandos. Sin embargo, para p>k tenemos 


N, (A—ag)""*=0 . 
y, por consiguiente, f, (x, y) se anula sobre N,. Consideremos ahora 
los subespacios N,, ...,,. Sea a,, ..., a, una base de %, tal que 


ay =0 (A—a98) —(jal, ..., m —1l). 
Puesto que a, (4A— ad)” =o0, se tiene para J+k > 2 
f, (ay, Ax) =(a,(A—ad)""*, Qs) =0. , 
Por otra parte, según la definición del signo de un divisor ele- 
mental, tenemos 
[,(4,, 2,) =(8, (4 —ad y", 41) = Ó6,. 
21 - 1843 
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Por consiguiente, la matriz de la función f, (x, y) en la base a,,...,Q, 
contendrá sólo un e'emento no nulo que será igual a 6, y se ha- 
llará al principio de la diagonal principal. De aquí se ve que la 
signatura de la función f, (x, y) sobre 3, también será igual a 6,. 
Razonamientos análogos se pueden realizar también en el caso de 
los subespacios M,, ...,YN,. Así obtenemos que la signatura de la 
función f,(x, y) sobre M, es igual a 6,4+8,+... +8,. Tomando 
en vez de la descomposición (18) la descomposición (19), llegaremos 
a la conclusión de que la signatura de la función f, (x, y) sobre Dt, 
es jgual a e, +82,+... +€¿. Por consiguiente, se tiene 


8, +, +... +6.=8,+€, +... +2 (20) 
Puesto que 6,, 8,==+w+ 1, de (20) resulta que los sistemas de núme- 
TOS Ó,, .... 04 Y €£1, --., €. pueden diferir sólo en el orden de se- 
cuencia de los números y que, por consiguiente, ambos sistemas de 
divisores elementales mayores 6, (A—a)", ..., 6, (A—a)”” y e, (A — 
—a)”, ..., E (A—a)"* coinciden. 


Consideremos ahora la función bilineal 
Í, (x, y) => (x (A—a6)+ 1, y). 


Esta función se anula sobre todos los subespacios de dimensión 
menor que mpy.,. Por ello, para la signatura de f, (x, y) sobre Vi, 
tenemos las expresiones siguientes: 


sign. WM, = sign. N, +... + sign. N, +sign. N,,, +... sign. N,, | (21) 
sign. M,=sign. P, +... + sign. P¿+sign. Ba, +... +sign. B,, 


donde aceptamos que My, =>... =Mp, > Mp, y. Puesto que hemos 
demostrado ya que las signaturas de la función f, sobre los subes- 
POS correspondientes de mayor dimensión coinciden, de (21) re- 
sulta que 


sign. Na, +--- +sign. N sign. Ba, +--- +sign. P,, 
es decir, 
rr + ---+0,=8p+1 +. . +Ej. (22) 


De (22) se ve que los divisores elementales de potencia m,.,, de da 
aplicación 4 también coinciden. Continuando este proceso, obtene- 
mos qUe los sistemas de divisores elementales de signo definido de 
la aplicación 4, calculados mediante las descomposiciones (18) y 
(19), coinciden. 

Veamos ahora qué puede decirse sobre la signatura del espacio 
principal Y, si se conoce un sistema de divisores elementales de 
signo definido de una aplicación simétrica «4 de este espacio. La 
descomposición (17) muestra que la signatura del espacio Y es igual 
a la suma de las signaturas de los subespacios d, «.., P,. En 
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aquellos subespacios BP, que corresponden a pares conjugados de va- 
lores propios existe un sistema normal positivo de coordenadas. Sin 
embargo la dimensión de éstos es par y, por consiguiente, la sig- 
natura es igual a cero. 

También es igual a cero la signatura de los subespacios que 
corresponden a divisores elementales reales de potencia par. Por ello 
quedan sólo los subespacios que corresponden a los divisores ele- 
mentales reales de potencia impar. La signatura de éstos es igual 
a+l, según sea positivo o negativo el correspondiente divisor ele- 
mental. Por consiguiente, 


S =S,—$Sa, (23) 


donde s es la signatura del espacio *, s, es el número de divisores 
elementales positivos y s, el número de divisores elementales nega- 
tivos reales de potencia impar de la aplicación 4. 

De las fórmulas (23) se desprende, en particular, que toda apli- 
cación simétrica de un espacio seudounitario de signatura s tiene por 
lo menos |s| divisores elementales reales de potencia impar. 

El estudio de las aplicaciones antisimétricas de los espacios seu- 
dounitarios se reduce directamente al estudio de las aplicaciones 
simétricas, ya que siendo 4 una aplicación simétrica, la aplicación ¿4 
será antisimétrica y viceversa. 


28.2. Aplicaciones seudounitarias. Las aplicaciones isométricas 
de los espacios seudounitarios se llaman aplicaciones seudounitarias. 
Sea YU una aplicación seudounitaria de un espacio Y. Representando £ 
en la forma de la suma directa de los subespacios radicales de la apli- 
cación U y agrupando los sumandos correspondientes a las raíces a 


y P, que cumplen la relación af==1, obtenemos una nueva des- 
composición de *: 


L£ =M._,¿M, 4M +... + Mo, 


donde los subespacios WD, son invariantes respecto a “UY y son, en 
virtud del teorema 3 del p. 25.1, reciprocamente ortogonales. Á cada 
uno de estos subespacios se puede aplicar una de las fórmulas de 


Cayley (p. 25.2): 
A= (8 —U) ($6 + U)”? (24) 


A=i ($6 +U ($ —U)!. (25) 


Como resultado obtenemos unas aplicaciones simétricas de los sub- 
espacios M,. De (24) y (25) tenemos 


U= (6 +A) S —iA)"! 


o 


y, respectivamente 
U= AB RHLADAS — d) 2. 
Lele 
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En el primer caso todo divisor elemental de la aplicación 4 de 
tipo (A—a)” se transforma en el divisor elemental (A— y)”, donde 
y = (1 + a) (1—¿a)-*, y en el segundo caso en el divisor elemental 
(A— y)”, donde y =— (1 +1a) (1 —ia)-*. Puesto que 4 es una apli- 
cación simétrica, sus divisores elementales no reales de tipo (A—a)” 
aparecen en forma de pares (A—a)”, (A—a)”. Sin embargo, 
(1 +19) (1 — (a)”* =(1—i0) (1 + :a0)”* y, por ello, los correspon: 
dientes divisores elementales de la aplicación U también aparecerán 
en forma de pares, pero éstos serán ya de tipo (A—-y)”, (A— y” 1)”. 
En cambio, si « es real, para y=(1+(¿a) (1 —i¿a)-! obtenemos la 
relación yy=1. Reciprocamente, de yy==1 se desprende que «u es 
real. Por consiguiente, las fórmulas (24) y (25) establecen una co- 
rrespondencia entre los divisores elementales de una aplicación seu- 
dounitaria U y los divisores elementales de una aplicación simétrica 4. 
Heros visto que las aplicaciones simétricas se determinan, salvo 
un isomorfismo, por sus sistemas de divisores elementales de signo 
definido. Por esto las aplicaciones seudounitarias se determinan, salvo 
un isomorfismo, por sus sistemas de divisores elementales de signo 
definido. Pero en estos sistemas Jos signos «más» y «menos» deben 
ser colocados ahora ante los divisores elementales que corresponden 
a los valores propios de módulo igual a la unidad. 


Ejemplos y problemas 
j. Realícese la demostración completa de todas las afirmaciones de los p. p. 28.1 


2. Sea L un espacio seudounitarlo de cuatro dimensiones de signatura 2 (es- 
pacio complejo de Lorentz). Tomemos como sistema principal de coordenadas 
de £ el sistema e,, €y. es y e, en el que el cuadrado escalar de un vector x == 
=Ex€1 + Esta + Eses + Ese, es de la forma (x, x)==El + E1 +EÍ—E%. Demuéstrese 
que la matriz de “toda Splicación simétrica pd espacio 2 e ser reducida, en 
un adecuado sistema principal de coordenadas, a una de las formas sigutentes: 


INARIACAN 


donde a, $, Y y Ó son números reales. Resuélvase el problema análogo para 
las matrices de las aplicaciones seudounitarias del espacio 2. 

3. Si n es la dimensión de un espacio y s es la signatura de una función 
bilineal hermitiana f, se llama caracteristica de f la expresión ia EA De- 
muéstrese que la característica de un espacio seudounitario £, en el que actúa 
una aplicación simétrica ,4, satisface la desigualdad 


¿a+ Y [+] ; 


donde h es igual a la mitad de la suma de los exponentes de los divisores ele- 
mentales complejos de la aplicación 4 y k recorre todos los valores de los ex- 
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ponentes de sus divisores elementales reales. El simbolo [5] representa el ma- 


yor número entero que no pasa de >. 
4. Sea, en las condiciones del probiema anterior, f (x, y) =(x4, y). Demués- 
trese que la característica de la función f cumple la desigualdad 


1344 Y [5] +N[]| , 


donde A es la mitad de la suma de los exponentes de los divisores elementales 
complejos de la aplicación 4, k' recorre todos los valores de los exponentes de 
los divisores elementales correspondientes a las raices reales no nulas y £” recorre 
lodos los valores de los exponentes de los divisores elementales correspondien- 
tes al valor propio nulo. 


EEES EEES E IEA 
Capítulo VII Espacios afines 


El concepto del espacio vectorial real de tres dimensiones surge 
de un modo natural al describir las propiedades principales del es- 
pacio físico corriente, siempre que en este espacio se haya destacado 
un punto como el origen de coordenadas. Puesto que ningún punto 
del espacio físico tiene ventaja alguna ante los demás, conviene 
tener, además del concepto de espacio vectorial, un modelo mate- 
mático que corresponda al concepto del espacio en el que no se 
havan fijado de antemano puntos algunos. Ejemplos de estos mo- 
delos son el espacio afín y el espacio euclídeo puntual. En este 
capitulo serán expuestos los elementos de la teoría de estos espacios. 
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29.1. Axiomática. Sea dado un espacio vectorial Y sobre un 
cuerpo conmutativo K. Se llama espacio afín A sobre el espacio 
vectorial £ un conjunto arbitrario tal que a todo par de elementos 
X e Y del mismo le corresponde un vector de £, indicado en lo 
sucesivo por XY, con la condición de que se cumplen las exigen- 
cias siguientes: 

A,: para todo XEA y todo vEl existe un elemento Y EA, y sólo 
uno, que satisface la relación XY =4; 

__ Á,; para cualesquiera X, Y y Z de U es válida la igualdad 
XY +YZ=XZ. 

Los elementos de un espacio afín se llaman puntos del mismo 
y los vectores de Y se llaman vectores libres del espacio A 

Para cualesquiera XEA y vEL indicaremos por X.v aquel 
punto Y €A para el cual XY =6. Según el axioma A, un punto 
asi de Ul existe y es único. De aquí, en particular, se desprende 
que para cualesquiera X, YEA y uE2L se tiene 


X-XY=Y y X(X-4)=u. (1) 
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En virtud del axioma A, tenemos XX +XY =XY y, por ello, 


XX=0 y X:0=X (XEM y 0€2). 
En vista del mismo axioma se tiene XY +YX=XX y, por ello, 


XY =-—YX. (2) 
Finalmente, para cualesquiera X, O, B, C, DEA se tiene 
(X-0B)-TD=X-(0B+CD). (3) 


En efecto, sea X-0B=Y e Y-CD=Z. Debido a A, y a (l), se 
iene 
y por esto 

(X-0B)CD=Z=X-XZ=X-(0B+CD). 


Pongamos en correspondencia a todo par (O, B) de puntos del 


espacio Y la aplicación de A en A, indicada por OB y definida 
mediante la fórmula 


—» 


0B: X=>X-0B (XENA, (4) 


es decir, tomemos X.OB= X-0B. Las aplicaciones OB (O, BE A) 
se llaman traslaciones (o también desplazamientos o traslados) del 
espacio A. La superposición de unas traslaciones OB y CD suele 
llamarse suma de estas traslaciones, es decir, se toma por definición 
que 


X-(0B+CD) =(X-0B)-CD=X-(0B +CD). (5) 


El producto de un elemento ¿€ K por una traslación OB se de- 
fine mediante la iórmula 


X-(»M0B) = X -(LOB). (6) 


El conjunto de todas las traslaciones del espacio A, provisto de 
las operaciones de adición y de multiplicación por todos los 14€ K, 
se indicará por £L(A). Las igualdades (5) y (6) muestran que la 
aplicación ÓX—»0X es un isomorfismo de 'L sobre L(A) y por 
esto L(%A) es un espacio vectorial sobre K. 

Fijemos ahora en Y un punto cualquiera O. Entonces la apli- 
cación X—ÓX (XEM) establece una correspondencia biyectiva 
entre los puntos de Y y los vectores de 2, El vector OX suele 
llamarse radio vector del punto X respecto al punto inicial O. El 


radio vector del punto desplazado X-BC se expresa en términos 
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O vector det punto dado inicialmente X mediante la fór- 
mula 


O(X-BC)=0X +-(0C —OB). (7) 


Efectivamente, tomando X.BC=Y, óbtenemos XFY = BT y, por 
consiguiente, 


0(X-BC) =0Y =0X + XP =0X + BC. 


Supongamos ahora dado un espacio vectorial € sobre un cuerpo 
conmutativo K. Llamemos puntos a los vectores de Y y pongamos 
en correspondencia a todo par (u, v) de ellos el vector uu=w—u. 
Está claro que en este caso las exigencias A, y A, se cumplirán 
sin duda alguna y de esta forma el propio espacio vectorial Y se 
convertirá en un espacio afín sobre sí mismo. Indicaremos este 
espacio afin por A(%). Puesto que la igualdad xy=u equivale a 
la relación y—x=u, obtenemos para las traslaciones del espacio 
A (2) la fórmula 


x-bo=x+ (c—b). (8) 


Desde el punto de vista puramente algebraico, es conveniente a 
veces considerar, además del concepto de un espacio afin sobre un 
espacio vectorial, el concepto de un espacio afín sobre un cuerpo 
conmutativo que surge del modo siguiente. 

Indiquemos por A el conjunto de todos los puntos de un espa- 
cio afín A sobre un espacio vectorial € sobre un cuerpo conmuta- 
tivo principal] K. Introducimos en A unas operaciones nuevas 
S(X, Y, 2) y P,(X, Y) tomando por definición 


S(X, Y, Z)=Z-XY y Py(X, Y)=X-(AXV) (9) 
y convertiendo con ello 91 en un álgebra nueva 
TW =(A; S, (PJ) (MER). 


Es fácil comprobar que en el álgebra 91* las operaciones S y P, 
poseen las propiedades siguientes: 
At: Para cualesquiera O, B, C, XEN” se tiene 


S(B, C, S(0, B, X) =S(0, C, X); (10) 
A;: Para cualesquiera O, B, XEA* y AEK se tiene 
S(0, B, P,(0, X) =P, (8, S(O, B, X)); (11) 


As: Fijamos en Y* un punto cualquiera O y mediante las opera- 
clones S y P, introducimos para los elementos de A* unas operaciones 
nuevas 


XHoY=S(O0, X, Y) y AA =P, (0, X), (12) 
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llamadas adición local y multiplicación local de los elementos de U* 
por los números A (en el punto O). Respecto a estas operaciones lo- 
cales +o Y hrp los elementos de U* forman un espacio vectorial 
sobre K que se indica en lo sucesivo por Yy. 

En efecto, hemos visto que la aplicación X—0OX (X € A) es 
una correspondencia biyectiva entre los puntos de A y los vecto- 
res de Y. Pasemos, de acuerdo con esta correspondencia, las opera- 
ciones vectoriales de * a A, es decir, tomemos por definición 


X+Y=Z<>0X+0Y=0Z y AX=Z>)1MX=0Z. (13) 


Entonces A se convierte en un espacio lineal sobre K y el punto 
O será el elemento nulo de este espacio. Puesto que 


X-AAB=Y => XY =21AB «“>»0Y —ÓX =2(0B—0A), 
y puesto que de (13) se deduce que 


OY —0X =1(0B-0A) <> Y —X =14(B—-A), 
tenemos 
XAAB=Y =>Y =X+12(B—A), 
de donde . 
XAAB=X-+12(B— A) (14) 
y, por consiguiente, 
S(X, Y, 2Z=Y+2Z-A, 
PAX, Y) = UY —X)4X, 
XA+oY=X4+Y y 4:ipAX=2AX. 


Después de esto las afirmaciones A;, A; y Az se hacen evidentes. 

Se llama espacio afin sobre un cuerpo conmutativo K un conjunto 
de elementos A provisto de una operación ternaria S (X, Y, Z) y una 
serie de operaciones binarias P,(X, Y) (ME K) que cumplen sobre A 


las exigencias Aj, Az y As. 


Un espacio alin sobre un cuerpo conmutativo XK, al igual que un espacio 
vectorial sobre un cuerpo conmutativo K, es un digebra (cuya signatura depen- 
de de X y es, en el caso general, infinita). Por esto para los espacios afines 
sobre un cuerpo conmutativo resultan definidos automáticamente una serie de 
conceptos como isomorfismo, endomorfismo, congruencia, etc. 


Hemos visto como todo espacio afin A sobre un espacio vec- 
torial * sobre un cuerpo conmutativo K puede ser convertido en 
un espacio afín A* sobre el cuerpo conmutativo K. Queremos de- 
mostrar ahora que de esta forma se puede obtener cualquier espa- 
cio afín sobre K. 

Sea, pues, B=(A, $, P,) un espacio afín sobre un cuerpo con- 
mutativo K. Representando la identidad (10) en la forma 


C+a(B+o X)=C +09 A (15) 
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y tomando B=0, obtenemos 


CH+o(0+X)=C+0X. 
Esta es una ecuación en el espacio vectorial £¿ y, por ello, 


es decir, el punto O es el cero del espacio Lo. 
Para cualesquiera puntos fijos O y B la aplicación 


X—S(0, B, X) (XED) 
del espacio B en sí mismo se llamará traslación de B y se indi- 
cará por OB. Por consiguiente, tomamos po? definición 
X:0B=S(0, B, X)=X+0B. (17) 
Representando la relación (16) en la forma X .00=X, vemos 
que la traslación 00 es la aplicación idéntica de B sobre sí mismo 
y que, en particular, 00=XX para cualesquiera O, XEB. 


Al igual que antes, llamamos suma 0B+CD de trastaciones la 
superposición de las mismas, es decir, tomamos 


x-(0B+CD)=(X-0B)-CD=S(C, D, S(0, B, X). (18) 


La identidad (10) significa que para las trasiaciones es válida 
da regla del triangulo 


0B+BC=0C, (19) 


de la cual se desprende, en particular, que 0B+B0=00, es de- 
cir, que las traslaciones OB y BÓ son aplicaciones recíprocamente 


inversas. 
De (15) y (17) obtenemos 
Xx-CD=X+¿D=X +AC+aD—2C)=X + a(D—p0), 
es decir, 
CD=B(D—C). (20) 
Combinando das fórmulas (20) y (19), llegamos a la relación 
0B+CD=0B+B(D—,C)=0(D=,C) 


que muestra que la suma de traslaciones es una traslación, 
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Definamos, finalmente, la operación de multiplicación de los 
números A€ K por una traslación OB, poniendo 


1-OB=0(4: o B)=0P, (0, B), 
es decir, aceptando que 


X-(/0B)=S(0, P,(O, B), X)=P,(X, X-0B). (21) 


De la fórmula (21) se ve que siendo OB=CD, se tiene 1-OB= 


=A-CD, es decir, la operación de muttiplicación de un número por 
una traslación está definida univocamente. 

TEOREMA 1. El conjunto L(U*) de todas las traslaciones de un 
espacio afin N* sobre un cuerpo conmutativo K es un espacio vecto- 
rial sobre K respecto a las operaciones de adición de traslaciones y 
de multiplicación de un número por una traslación. El espacio L (X*) 
es isomorfo a cualquier de los subespacios *¿. Poniendo en corres- 


pondencia a todo par de puntos X, Y de YU* la traslación XY ELGI 
convertimos U* en un espacio afin A sobre el espacio vectorial L(%U*). 
Si en el espacio YU se introducen mediante tas fórmulas (9) las ope- 
raciones S y P,, se obtiene de nuevo el espacio A?. 

Las dos últimas afirmaciones son evidentes, ya que, por ejem- 
plo, las fórmulas (9), aplicadas al espacio A, se convierten simple- 
mente en las fórmulas (17) y (21). Demostremos las dos primeras 
afirmaciones, 

IAS un punto cualquiera O€ A* y consideremos la apli- 
cación 


A:X—OX (XE2,). 
Puesto que cualquier traslación puede ser representada en la 


forma OX, resulta que A es una aplicación de *, sobre £ (A). 
Veamos si esta aplicación A conserva las operaciones" de adición y 
de multiplicación por números. Tenemos 


— 


ZOX Fo Y) =Z + o (A + oY)=(Z+0X)+0Y =2Z-(0X + 01), 


es decir, O(X+/oY)=0X +0Y y, por consiguiente, 
(AF Y) A=XA+H+YA. 


Análogamente, de (21) obtenemos (A4-¿X) A =14-XA. Por consi- 
guiente, la aplicación A es un isomorfismo de *, sobre L(A”) res- 
pecto a las operaciones de adición y de multiplicación por núme- 
ros y, por ello, L(A*), así como *,, es un espacio vectorial sobre K. 

Planteemos, finalmente, la pregunta: ¿bajo qué condiciones 
serán isomorfos dos espacios afines? 
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El concepto de isomorfismo suele introducirse para las álgebras arbitrarias 
con una misma signatura. Los espacios afines sobre un cuerpo conmutativo K 
han sido definidos como élgebras cuya signatura depende del cuerpo conmuta- 
tivo K. Por ello para los espacios afines sobre un mismo cuerpo conmutativo 
está definido también el concepto de isomorfismo. En cuanto a los espacios 
afines sobre un espacio vectorial dado, éstos mo han sido definidos como unas 
álgebras de sas cdo fija, sino como unos sistemas de una estructura más 
compleja para los cuales no hemos introducido por ahora el concepto de iso- 
morfismo. 


Introduzcamos la definición siguiente. 

Se llama homomorfismo de un espacio afín A, definido sobre un 
espacio vectorial £, en un espacio afín B, definido sobre el mismo 
espacio vectorial Y, toda aplicación puntual p: A—-B para la cual 


XY =X*YY (X, Y EM). (22) 
Está claro que dicha condición equivale a la siguiente: 
(X.v0)y=X*.uv (XEA y vELlL). 


Se ve de (22) que la aplicación q transforma distintos puntos 
en distintos y que siendo q un homomorfismo de A sobre Y, la 
aplicación inversa q”* es un homomorfismo de Y sobre Y. 

Un homomorfismo de Y sobre Y se llama isomorfismo si la 
aplicación inversa es un homomorfismo de Y sobre Y. Luego, para 
tos espacios afines sobre un espacio vectorial fijo los conceptos de 
homomorfismo y de isomorfismo son equivalentes. 

Un isomorfismo de un espacio afin Y, definido sobre un espacio 
vectorial €, sobre si mismo se llama automorfismo de Y sobre *. 

TEOREMA 2. Todos los espacios afines sobre un mismo espacio vec- 
torial son isomorfos. Los automorfismos de un espacio afín sobre un 
espacio vectorial son las traslaciones del mismo. 

Sean A y Y unos espacios afines sobre un espacio vectorial %, 
Tomemos unos puntos arbitrarios AEA y BE€B y consideremos la 
aplicación q: Av— Bv (vE Y). De los axiomas A, y A, deducimos 
directamente que q es un isomosfismo de A sobre 

Además, si q es un automorfismo del espacio afín YA sobre el 
espacio vectorial £, oblenemos de la fórmula (22) que AX =4ÁYX>, 
de donde X*=A*- AX y por ello 


X9=X-XA*- AX=X(AX+XA7)=X-AA?, 


es decir, y es la traslación de Y determinada por el vector 4A?. 
Reciprocamente, si q es una traslación, se tiene que q es de la 
forma X»= X.v, donde v es un vector arbitrario fijo de Y, y por 


lo tanto e 
XV (ROYO =X?7. 


Un espacio afín sobre un cuerpo conmutativo K es un álgebra de signatura 
S, P, (AEK) 
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Un isomorfismo q de un espacio afín Y, definido sobre un 
cuerpo conmutativo K, sobre un espacio afín B, definido sobre el 
mismo cuerpo K, es una aplicación biyectiva de A sobre B que 
satisface las condiciones 

S(X, Y, Zyy=S(Xt, Yr, Zv), 
P,(X, YI =P, (X?, Y») 


o, que es equivalente, las condiciones 


(2. XY y =2Z*.XvY>, (23) 
(X-AXY Jr =X?-AXPY 7. (24) 


TEOREMA 3. Para que una aplicación q: U-—B de un espacio 
afin YA, definido sobre un cuerpo conmutativo K, sobre un espacio 
afin B, definido sobre el mismo cuerpo, sea un isomorfismo, es nece- 
sario y suficiente que la aplicación y. XV —. X+Y* (X, Y € A) sea 
un isomorfismo del espacio vectorial L (A) sobre el espacio vectorial L ($B). 

NECESIDAD. Probernos, ante todo, que la aplicación Y es uní- 
voca. Sea XY =UV (X, Y, U, VEA) y, por consiguiente, Z.XY = 
=Z+UV. De (23) obtenemos Z?. XrY?r=Zv.UvV?. Puesto que Z? 
recorre todo el espacio B, de la última igualdad tenemos X>Y? == 
= UvY* y por esto la aplicación y es unívoca. Representando ahora 
la relación (23) en la forma (Zu)? =Z*u*, obtenemos para cuales- 
quiera o, wE L (A) 


Z+ (04 w)7 = (2 (04-0))?* =((Z0) w)? == (2904) we a Zo (ur 4-w%), 
de donde 


(uv +w)Y = 0% + w. (25) 


Análogamente, representando (24) en la forma (X-4u)? = X?.Au?, 
obtenemos 
Xv (du)? =(X- (M1)? = X?-2u?, 
de donde 
(A)? =4u?, (26) 


Las relaciones (25) y (26) significan que p es un isomorfismo 
de L(A) sobre L(B). 

SUFICIENCIA Supongamos que dada la aplicación y: A—-B del 
conjunto A sobre el conjunto Y, la aplicación y: XY —- X?Y? es 
un isomorfismo de L(A) sobre L(B). Puesto que en un isomorfismo 
de espacios vectoriales el vector nulo corresponde al vector nulo, 
de X?:uY*+ resulta XY?=0 y por esto XY =0 y X =Y', es decir, 
la aplicación qp es biyectiva. Para demostrar ahora que para q es 
válida la relación (24), tomemos cn Y un punto U tal que XY =ZU. 
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Entonces se tiene 
(Z. XY Y? =U?+=Z*-ZvU9= Z9+.XtY 9 (27) 
y, en particular, 


(Zujt =ZruY (uEL(A). 
Ahora resulta de (26) que 
(X-AXY )?= X9 (AXVY yt = XA XV 9 = X9AXPY Y 


que es lo que se quería demostrar. 

COROLARIO !. Los espacios afines sobre un cuerpo conmutativo dado 
son isomorfos cuando, y sólo cuando, sus espacios vectoriales de tras- 
taciones son de tuna misma dimensión. 

Efectivamente, según el teorema 3, un isomorfismo entre espa- 
cios afines sobre un cuerpo conmutativo equivale a un isornorfismo 
de los espacios vectoriales de traslaciones y un isomorfismo de es- 
pacios vectoriales equivale (véase el p. 4.3) a la coincidencia de 
sus dimensiones. A 

COROLARIO 2. Los automorfismos de un espacio afin U sobre un 
cuerpo conmutativo que dejan en su sitio un punto OEA son apli- 
caciones de tipo q: X—»0-0X?, donde «y es un automorfismo fijo 
cualquiera del espacio vectorial L (A). 

En efecto, siendo p un automorfismo del espacio A que deja 
en su sitio el punto O, se tiene 


xr=0-.0X?=0-07X?=0-0XV. 
Reciprocamente, si p es un automorfismo de L (A), se tiene 
X+Y?=(0-0X%) (0-0Y +) =0Y+—0X? =(07 —0X)?= XY% 


y por esto q es, según el teorema 3, un automorfismo del espacio %l. 

TEOREMA 4. Siendo O un punto arbitrario de un espacio afin Y 
sobre un cuerpo conmutativo K, todo automorfismo y del espacio AU 
sobre K puede ser representado en la forma 


P= PoOPL: (28) 


donde y, es una traslación adecuada de Á y qo es un automorfismo 
de YU que deja en su sitio el punto O. Para todo automorfismo « la 
descomposición de tipo (28) es univoca. 

Sea q un automorfismo del espacio Y. Entonces la aplicación 


Po =-0%0 es un automorfismo de A y de las relaciones 


O-po=0*-010=0 


se ve que o deja en su sitio el punto O. Poniendc q, =00», obte- 
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nemos la igualdad (28). Sea ahora 
P=P0P, =P0 PL”, 
donde qí” es una traslación y «£” un automorfismo de A que deja 
en su sitio a O. Tenemos entonces 
O- qe” 
Puesto que la traslación qí'”pz* deja en su sitio el punto O, se 
tiene poz ' =00, de donde q”? =q, y qe? =0.. 


29.2. Variedades lineales. Sea A un espacio afín sobre un cuerpo 


conmutativo K. El espacio vectorial L (A) formado por las trasla- 
ciones de Y1 lo indicaremos por £. A todo par de puntos X, Y €A 


corresponderá entonces un vector XY =XY de £ y esta correspon- 
dencia satisfará. los axiomas A, y A, del p. 29.1. Se llama dimen- 
sión del espacio afin Y la dimensión del correspondiente espacio 
vectorial £. En particular, un espacio afin de dimensión O está 
compuesto por un punto solo. 

Unos puntos Xy, X,, ..., X, del espacio X se llaman fineal- 
mente independientes, sí son linealmente independientes los vectores 


AA XA gs...) XAoA sz. Se dice que un punto X € A depende line- 


MDin=1 


pL' =0- 0 'po' = 0. 


almente de la sucesión de puntos Xo, X,, +-., Xm, si el vector 
X¿X puede ser expresado linealmente en términos de los vectores 
XX 3 AGA > 


” En estas definiciones el punto X, desempeña un papel especial. 
Pero de hecho, la dependencia lineal mo está ligada al orden de los 


puntos en ta sucesión X,, Xy, ..., Xy. Sea O un punto arbitrario 
del espacio U. Entonces se tiene 


XX =0X,—0X, (6=0, l, ..., m) 


y el hecho de que el sistema de puntos X,, ..., X, sea lineal- 


mente independiente equivale a que para cualesquiera A,, ...,4.E€K 
de la relación 


MOX,—OX) +... HA-MOX, —0X,)=0 


se desprenda 4, =... =4,=0. Tomando A,=—A,—... —A,,, Vemos 
que los puntos X,, X,, .... X, son linealmente independientes cuan- 
do, y sólo cuando, para cualesquiera Mo Aj ..., AMÑEK de las 
relaciones 


A+tA +... +40, 
AOX,HAOX +... FAMOX 2 =0 
se deduce que h¿=2,=...=2,=0. 
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En esta afirmación no destaca ya ninguno de los puntos 
or Az» ---» An y por esto si la sucesión de puntos X,, X,, ... 
es linealmente E UNER también será linealmente dependiente 
la sucesión X¿,. Xi, ..., Xi, cualquiera que sea la permutación 
(os bs +...» fa) de los números 0, Il, ..., m. Esto también se re- 
iere al concepto de dependencia lineal de un punto X respecto a 
una sucesión Xy, Xy, ..., Apo 

En las definiciones dadas se AS que la sucesión X¿, XA, ..., XA 
tiene no menos de dos términos (tm > 1). Por definición, se acepta 
que un sistema compuesto de un punto es linealmente dependiente 
que el hecho de que un punto X dependa linealmente del sistema Xx 
significa que X=Xp. 

De los teoremas del p 4.2 sobre la dependencia lineal de los 
vectores obtenemos itectamente que 

a) una sucesión de puntos Xy, Xy, ..., Xn (m>1) es lineal- 
mente dependiente cuando, y sólo cuando, al menos uno de sus tér. 
minos depende linealmente de los demás; 

b) sí un punto X depende linealmente de los puntos Xo, ..., Am 
y todo punto X'; deper:de linealmente de los puntos Yo, A 
punto X depende linealmente de los puntos Y,, ..., 

c) si un punto X depende linealmente de los puntos x E 0 
el punto X depende linealmente también de los puntos X,, X,, ..., Xm, 
donde X., es un punto cualquiera del espacio. 

De la propiedad c) se deduce que si un sistema de: puntos X., 
Xu...» Xy €s linealmente independiente, cualquier subsistema del 
mismo que contiene más de un punto es también linealmente inde- 
pendiente. Esto permite introducir la definición siguiente: un con- 
junto arbitrario (finito o infinito) de punt«s WM de un espacio afin 
Al se llama linealmente independiente, si todo su subconjunto finito 
que contiene más de un punto es linealmente independiente. 

Análogamente se dice que un puto X EN depende linealmente 
de un conjunto de puntos EN si X depende linealmente de algún 
subconjunto finito de puntos de MI. 

Se lama adherencia lineal de un conjunto cualquiera no vacío Di 
de Spee de un espacio afín YA el conjunto formado por todos los 
puntos X € A que dependen linealmente del conjunto M. Un conjunto 
ri lama linealmente cerrado si Mi coincide con su adherencia 
ineal. 

Los conjuntos linealmente cerrados de puntos de un espacio afín 
se llaman planos o variedades lineales del mismo, En otras palabras, 
un conjunto Wi de puntos de un Aa afín Y se llama plano 
de Y, si cualesquiera que sean X,, ..., X, E MI este conjunto con- 
tiene también cualquier punto del espacio Y que dependa líneal- 
mente de los puntos X,, ..., 

De aquí se deduce directamente que todo punto y el propio 
espacio A son indudablemente planos. 
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Dos planos VW? y MN se llaman incidentes si uno de ellos está 
contenido en el otro. Si M < NM, se dice también que M se encuentra 
sobre N (o que N pasa por Mi). - 

Entre los planos de un espacio afin Y y los subespacios lineales 
del espacio vectorial £ (Al) existe una relación muy simple que tam- 
bién se emplea a veces para definir el concepto de plano. 

TEOREMA 1. Sí para un conjunto Di de puntos de un espacio afín 
M y un punto PEM el conjunto L(M) de lus vectores de tipo PX 
(XEM es un subespacio lineal del espacio vectorial L(U), el con- 
junto WM es un plano de U. Para cualquier plano no vacio Wi de un 
espacio afin Y y para cualquier punto PEM el conjunto L(M) de 
todos los vectores de tipo PX (X € M) es un subespacio lineal de L (Ul) 
que no depende de la selección del punto P en Vi. 

Efectivamente, sea PE ME y sea L(M) un subespacio de L£ (21). 


Si Xi, --«, X € y un punto XE A depende linealmente de 
Xi +...) Xa se tiene entonces para unos valores convenientes 
Ars <<.» AHEK 


PX=MPX +... +AÓPX,.€L(M), 


ex decir, para un punto Y € DY convenientemente escogido se tiene 
PX =PY, de donde X=Y€M. 

Reciprocamente, sea M un plano de Y y sean P, X, YEM y 

A, Ó€ K. Poniendo 

Q=P-(APX +uPY), 
vemos que 

PQ=APX +uPY, 
es decis, el punto Q san linealmente de P, X e Y y, por con- 
siguiente, QEM y PQEL(DI); es decir, L(M) es un subespacio 
lineal de L(A). Para cualesquiera P, P,, XE€ Wi tenemos P,X = 
= PX—PP, y, por consiguiente, el conjunto de los vectores de tipo 
P,X (XEM) coincide con el conjunto de los vectores de tipo PX 
(XEM). 

PEE dos importantes corolarios que se desprenden del teo- 
rema 1. 

COROLARIO t. Sea O un punto fijo de un espacio afín YU, sea M 
un plano que pasa por O y sea P un punto arbitrario de A. Enton- 
ces el conjunto N=M.OP formado por todos los puntos desplazados 
del plano M es un plano de X que pasa por el punto P. Reciproca- 
mente, si N es un plano que pasa por P, el conjunto M=N-OP es 
un plano que pasa por O 

En efecto, de OE M se deduce que P=0.OPEN y para todo 
punto XENÑ existe un punto Y EM tal que X =- Y.OP. De aqui se 
tiene YX =0P y PX =0Y y por to tanto L (M) = L(M.0P). 


22—1843 
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COROLARIO 2. Para todo punto fijo O de un espacio afin A la apli- 
cación X—0X (X EA) determina una correspondencia biyectiva 
entre los subespacios lineales del espacio vectorial L(A) y los planos 
del espacio Y que pasan por O. 

La demostración es evidente. 

Hemos señalado en el p. 29.1 que si llamamos punto a todo vector uy 
de un espacio vectorial Y y si tomamos uw=w-—u, se obtiene el 
espacio afín A(%) sobre £. ¿Qué conjuntos de vectores de L serán 
los planos de A (4)? 

Tomando por el punto fijo O de A(%) el vector nulo, vemos que 
la aplicación X-—»0X, de la cual se trata en el corolario 2, se 
convierte en la aplicación idéntica w-—w. Luego, son planos del 
espacio A(%) que pasan por O todos los subespacios lineales 
del espacio *, y sólo ellos. Los planos que pasan por un punto 
arbitrario pE* son, según el corolario 1, los conjuntos de vectores 
de tipo p-+Yt, donde Mi es un subespacio lineal del espacio Y, 

Se llama base de un plano arbitrario Yi de un espacio afín A 
todo conjunto linealmente independiente de puntos, cuya adheren- 
cia lineal coincide con M. Está claro que un conjunto de puntos 
A¡(¡€ /) de un plano M? es una base del plano AM cuando, y sólo 
cuando, el conjunto de vectores A, A, (¿€ )), donde A, («€ /) es un 
punto arbitrario fijo, es una base del espacio vectorial L(Wi). En 
virtud del teorema sobre las bases de los espacios vectoriales del 
p. 4.2 tenemos: 

a) todo piano de un espacio afín posee una base; 

b) si un plano M está contenido en un plano 3, toda base del 
plano Mi es una parte de una base convenientemente escogida de M; 

c) todas las bases de cualquier plano fijo M son de una misma 
potencia igual a dim.L(M)+ 1. 

Se Hama dimensión de un plano WM de un espacio afin U la 
dimensión del espacio vectorial L(M) que le corresponde. De la 
propiedad c) se deduce que la dimensión de un plano es igual a la 
potencia de cualquier base suya disminuida en 1. El conjunto vacío 
de vectores de un espacio afín A se llama a veces plano vacío de A 
de base vacía. La dimensión del plano vacío se toma, por defini- 
ción. igual a —1. 

Los planos O-dimensionales son los puntos del espacio YU. Los 

lanos unidimensionales se llaman rectas (o líneas rectas) del espacio 
3. Cualesquiera dos puntos distintos de una recta forman una base 
de la misma y por cualesquiera dos puntos distintos de un espa- 
cio A pasa una recta, y sólo una. En general, cualesquiera R-+ 1 
puntos linealmente independientes de un plano de dimensión k for- 
man una base de este plano y por esto por cualesquiera k+1 pun- 
tos linealmente independientes (k es un número finito) de un espa- 
cio alin Y pasa un plano £-dimensional de este espacio y sólo uno. 
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Siendo Wi y N dos planos cualesquiera de un espacio afín A, 
convendremos en indicar por Di y M la adherencia lineal del conjunto 
MiuN. El plano MYMN se puede definir también como la inter- 
od de todos los planos del espacio A que contienen a los planos 
M y A. 

La operación Y , considerada como una operación binaria definida 
sobre el conjunto de todos los planos de un espacio afín, es con- 
mutativa, asociativa e idempotente (es decir, My Mi =3D?); además, 
para cualesquiera planos DM y N de un espacio A se tiene 


M<NEM Y N 3. 


Por ejemplo, siendo X,, ..., X, un conjunto finito de puntos 
de un espacio Al, se tiene que 


M=X,VX,V...V Xa 
es la adherencia lineal de dicho conjunto, es decir, es el menor 


plano que pasa por los puntos X,, ..., Xp. La dimensión de Ui 
es igual al número máximo de puntos linealmente independientes 
en el conjunto X,, ..., X, disminuido en 1. En particular, 


dim (X,VX,V...VX.) <m=1. 


Es fácil ver que tiene lugar el siguiente teorema general: 
TEOREMA 2. Cualesquiera que sean los planos Vi y N de un espacio 
afin YU se tiene 


dim. (Mv9I) < dim. M+ dim. N +1. (1) 
Si los planos Vi y NM poseen un punto común, se tiene 
dim. (MVI)Y + dim. (MNnY) = dim. DM -+ dim. 9. (2) 


Demostremos primero la igualdad (2). Sea 0€M NN. Entonces, 
la aplicación X —0OX del espacio A sobre el espacio vectorial L (Y) 
transtorma los planos de A que pasan por el punto O en los sube- 
spacios lineales del espacio vectorial L(%4), con la particularidad de 
que conserva las dimensiones y la relación de inclusión. Por esto 
la fórmula (2) es un corolario directo de la fórmula análoga que 
tiene lugar para los subespacios lineales de los espacios vectoriales 
(véase el teorema ! del p. 6.1). 

La estimación (1) se deduce de la fórmula (2). Efectivamente, 
si los planos TM y N poseen un punto común, tenemos según (2) 


dim. (M Y N) < dim. M + dim. M. (3) 


Sea MN N = SL. Agregando el punto OEM a una base del plano 
3%, obtenemos una base de OYM, .es decir, 


dim. (OVM) =dim.N + 1. (4) 


92. 
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Puesto que los planos M y O VM poseen el, punto común O, 
tenemos basándonos en (3) 


dim. (WM V N) = dim. (Vt y O Y NM) < dim. M + dim. (O Y N), 


y de aquí, debido a (4), obtenemos (1). 
Por lo tanto, si los planos Wi y Ni no tienen puntos comunes, 
la dimensión de Di Y N está comprendida en los límites siguientes: 


máx (dim. M, dim. N) < dim. (M V 9) < dim. M+dim. NH 1. 


Es fácil comprobar, considerando ejemplos, que la dimensión 
de My N puede tomar efectivamente cualquier valor comprendido 
en estos límites. 

A todo plano M de un espacio afín arbitrario 9 le corresponde 
el subespacio lineal L (Mi) del espacio vectorial £ (A). Según el $ 6 
(véase el problema 3 de la pág. 113), en L(A) existe un subespacio 
complementario Y, que satisface las condiciones 


LM+2=£(% y LM)N2,=o, 


donde o es el vector nulo del espacio L (A). La dimensión de £,, 
que es la misma para todos los subespacios complementarios, se 
llama codimensión de L(M) en 1.(%). Por definición, se llama co- 
dimensión de un plano Di en un espacio U la codimensión del sube- 
spacio vectorial L(Wi) en el espacio vectorial L (A). 

Esta definición puede darse de otra forma. Para todo plano Mi 
diremos que un plano Y es complementario de M en el espacio Y, 
si MY N=4A y si la intersección Vin NM consta sólo de un punto. 
Está claro que, en estas condiciones, el subespacio £ (Y) es comple- 
mentarlo de L(M?) en L(A) y por ello la codimensión de un plano 
Wi en el espacio Á es igual a la dimensión de cualquier plano com- 
plementario. 

Puesto que los planos recíprocamente complementarios poseen 
un punto común, obtenemos, aplicándoles ta fórmula (2), la igualdad 


dim. M +codim. Mi = dim. Y. (5) 
Si el espacio Y es de dimensión finita, obtenemos de (5) 
codim. M = dim. A— dim. Y. (6) 


Para un espacio A de dimensión finita obtenemos de las fór- 
mulas (2) y (6) el resultado siguiente: 

TEOREMA 3. Para cualesquiera dos planos Di y M que se intersecan 
de un espacio afin Y se tiene 


codim. (M NN) + codim. (M y MN) =codim. M + <odim. N. (7) 


No obstante, es fácil ver que la fórmula (7) es válida también 
para los espacios de dimensión infinita. 
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COROLARIO. Si la intersección de los planos N,, N,, ..., NM, de 
un espacio afin A arbitrario es no vacía, se tiene 


codim. (NN... NN,) <codim. N, +... +codim. Ñ,. (8) 


Para s=2, la fórmula (8) se desprende directamente de (7) y en 
el caso general ella se obtiene aplicando sucesivamente la fórmula 
del caso particular indicado. 

Si el plano Di se encuentra sobre el plano NR de un espacio Y, 
entonces, considerando Ñ como el espacio afín sobre L (Y) e indi- 
cando por codim.¿ Mt la codimensión del plano Di en el espacio YN, 
obtenemos la fórmula 


codim. ¿M -+ codim. N <= codim. M (9) 


que se demuestra fácilmente pasando a los subespacios del espacio 
vectorial L(A). De la fórmula A se deduce, en particular, que si 
la codimensión del plano M en A es finita y MN, se tiene 


codim. N < codim. M—]. (10) 


Los planos de codimensión igual a l se llaman hiperplanos. En 
otras palabras, en un espacio afín de dimensión finita n se llaman 
hiperplanos los planos de dimensión r— 1. Luego, por cada n pun- 
tos linealmente independientes de un espacio de este tipo pasa un 
hiperplano, y sólo uno. 

Consideremos ahora un conjunto cualquiera finito de hiperplanos 
P.. -.., B, de un espacio afín arbitrario A. Debido a la fórmula (8) 
tenerrios 


0< codim. (B,nN...NB)<s. (11) 


Se dice que los hiperplanos P,, ..., P, (para s no mayor que la 
dimensión de Y) se encuentran en posición general, si tiene lugar 
la igualdad exacta 


codim.(B,N...NB)=s. (12) 
Probemos que para todo ¿<s de (12) resulta 
codim.(B,N...N By) <f. 
En efecto, si fuese 
codim. (PR, N-..NBy<f, 
tendríamos, debido a (8) y a (11), 
codim. (BN... ABIN(R,,N.-.NB))< 14 (s—1)=s 


lo que estaría en contradicción con (12). 
TEOREMA 4. Todo plano M de una codimensión finita s es una in- 
tersección de s hiperplanos convenientemente escogidos. 
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Tomemos una base de Wi y complementémosla con unos puntos 
A, ..., As hasta obtener una base de todo el espacio Al. Sea PB, 
la adherencia lineal del conjunto MUA,, ..., Aj=1) ÁAjsar +.» As). 
Como PU y P/VA,=4, resulta que YN, es un hiperplano 
(i=1l, ..., $) y que 
MR N...NB.. 
De A; Pf, tenemos 
ASP, BP NB... BN...Rs, 

de donde, debido a (10), 


codim.(B,N...NB,)=>s. 
Comparando esta desigualdad con (11), obtenemos 


codim.(Y,nN...nNB)=s. 


Puesto que las codimensiones de los planos M y B,N... NY, coin- 
ciden y el primero está contenido en el segundo, ambos planos, 
debido a (11), coinciden que es lo que se quería demostrar. 

Para terminar, haremos unas observaciones relacionadas con la 
definición del concepto del plano aceptada más arriba. Esta defi- 
nición puede ser enunciada de nuevo en la forma siguiente: un con- 
junto MM de puntos de un espacio afín Y se llama plano, si para 
todo número natural s y para toda sucesión A,, ..., A, de puntos 
de Mi cualquier punto del espacio A, que dependa linealmente de 
los puntos de la sucesión mencionada, pertenece a M. De hecho, es 
suficiente tomar en esta definición s =3 y para varios tipos de cuerpos 
conmutativos principales K es suficiente tomar incluso s= 2. Tiene 
lugar concretamente el teorema siguiente: 

TEOREMA 5 Sí un conjunto Mi de puntos de un espacio afin Y con - 
tiene con tres cualesquiera puntos suyos todos los puntos de U que 
dependen linealmente de éstos, el conjunto Wi es un plano. Si U es 
un espacio afín sobre un cuerpo conmutativo K, de caracteristica di- 
ferente de 2, y st un conjunto Wi con dos cualesquiera puntos suyos 
contiene todos los puntos de A que dependen linealmente de éstos, el 
conjunto M es un plano de 4. 

Demostremos la segunda afirmación. Supongamos que un conjunto 
M. cumple las condiciones de esta afirmación y que X,, X,, Xy... 
es una sucesión de puntos de Wi. Debenios demostrar que para cua- 
jesquiera A,, ...,4,€ K ta relación 


XX AX XA ho... PAX X 


implica X € M. Para s*=l esto es válido por el enunciado mismo 
del teorema. Aplicando ahora la inducción, aceptamos que la impli- 
cación indicada es válida para un s> 1. Sea 


X Y =A XX, + e... O 
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Consideremos unos puntos X y Z que satisfacen las condiciones 
XX =MA AA E. FAA LA, Y Xol WA AA 


Según la hipótesis de inducción, de estas relaciones resulta que 
XEM y ZE ME. Tomando ahora (fig. 5) 


ss 


IB IRIXD, 


vemos que el punto B depende linealmente de X y de: Z y que el 
punto Y depende linealmente de los puntos X, y B. Basándonos 
en las condiciones del teorema, obtenemos 
de aquí sucesivamente que BE e Y EM Y 
que es lo que se quería demostrar. La pri- 
mera afirmación del teorema 5 se demuestra 
análogamente, pero sin emplear el punto B, 2 
y por esto ella es válida independiente- 
mente de la característica del cuerpo con- X 
mutativo K. Es fácil ver que para cuerpos 
conmutativos de característica 2 la segunda X 
afirmación no tiene lugar. 0 
Hemos introducido en el p. 29.1 dos Fig. 5. 
conceptos principales: el de un espacio afín 
sobre un espacio vectorial y el de un espacio afín sobre un 
cuerpo conmutativo. En este punto hemos considerado hasta el 
momento los espacios afines sobre los espacios vectoriales. Sea 
ahora A un espacio afin sobre un cuerpo conmutativo K y sean 
S(X, Y, Z) y P,(X, Y) las operaciones principales de A. Hemos 
visto ya en el p. 29.1 que las traslaciones de A son unos automor- 
fismos del espacio A sobre K de tipo especial. Demostremos ahora 
que un punto X de un espacio Y depende linealmente de unos puntos 
Xo A ... X, de Y cuando, y sólo cuando, X se expresa en forma 
de un polinomio en Xo, ... Xy mediante las operaciones S y P,. 
En efecto, si 


XX WAX X Ho PAX, 
donde A,, ..., 4, €K, se tiene según el p. 29.1 
X=(X AX Xy). ..) AA 0X mo (13) 
Pero para cualesquiera B, C, ZEA y AEK se tiene 
Z-1BC=S(B, P,(B, C), Z). 


Transformando mediante esta fórmula el segundo miembro de la 
iguaiídad (13), obtenemos la expresión requerida de X en forma de 
un polinomio en X,, X,, ..., X,. Recíprocamente, de 


X=S(Y 1) Y, Y) y 2=P, (Y, Y.) 
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se deduce que E 
YX =Y Y, e Y Z=AY Y, 


es decir, que X y Z dependen linealmente de Y, Y,, Y, y por esto, 
si X se expresa en forma de un polinomio en X,, X,,..., Az, el 
punto X depende linealmente de X,, X,. ..., Xm- 

Según la definición, un conjunto Wi de puntos de un espacio A 
se llama plano, si este conjunto Wi con cualesquiera puntos suyos 
Xi --., Ap contiene también todos los puntos de Y que dependen 
linealmente"de éstos, es decir, contiene los valores de todos los po- 
linomios en X,, ..., X,,. En otras palabras, los planos de un 
espacio A son simplemente subálgebras del álgebra A y las adherencias 
lineales son las subálgebras generadas por los elementos de los con- 
juntos correspondientes. 


29.3. Planos paralelos. Hemos visto ya que para todo plano Yi 
de un espacio afín M el conjunto L (Mt) de todos los vectores de tipo 
XY (X, Y € VI) es un subespacio del espacio vectorial L(A). El 
subespacio £ (Mit) suele llamarse frecuentemente subespacio tangente 
al plano MI. 

DEFINICIÓN. Los planos M y NR de un espacio U se llaman para- 
lelos (notación simbólica M||NM), sí sus espacios vectoriales tangentes 
L (M) y L(N) son incidentes, es decir, si L (Dt = L(N)o LS < LA. 

De esta definición se desprenden inmediatamente varios corola- 
rios importantes. 

COROLARIO 1. Dos planos Vi, y M, que se intersecan son paralelos 
cuando, y sólo cuando, uno de ellos está contenido en el otro. 

Efectivamente, si M, y Vi, tienen un punto común O, entonces 
L (VW!) (¿= 1, 2) es el conjunto de vectores de tipo OX (X E M,) y por 
ello la incidencia de los espacios tangentes L(Wt,) y L (M,) equivale 
a la incidencia de los planos M, y Mi,. 

COROLARIO 2. Si los planos MY,, M, y M, son de una misma di- 
mensión finita (o de una misma codimensión finita) y M,||M, y 
M, ||M,, se fiene DI, || Dt,. 

Las dimensiones (las codimensiones) de los espacios tangentes 
L (M¿) son finitas e iguales. Por ello la incidencia de L(Mt,) y L (Vi) 
equivale a la coincidencia de los mismos y la afirmación del coro- 
lario se reduce a la observación trivial de que L(M,)=L£(Mt,) y 
L(Wt,) =L (M,) implican! L (M,) =L (V,). 

El corolario 2 significa que para cualquier % finito todos los 
planos £-dimensionales de un espacio afín arbitrario A se descom- 
ponen en haces de planos paralelos entre sí. Estos haces se llaman 
a veces direcciones k-dimensionales en A. 

COROLARIO 3. En un espacio afín YU se tiene 


MN || V > ee 
para cualquier plano M y para cualquier traslación u € L (A). 
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Electivamente, el espacio tangente L(M-.u) está formado por 

vectores de tipo XuYu (X, Y EVI). Pero 
XuYu=XuX +XY +YYu=—u+XY +u=XY 
y por ello L(M-u)= L£L (DM). 

COROLARIO 4. Por fodo punto B de un espacio afín pasa un hi- 
perplano Y, y sólo uno, paralelo a cualquier hiperplano Wi dado de 
antemano. 

Si BENM|, se ve del corolario 1 que el único hiperplano que pasa 
por B y es paralelo a Wi, es el propio hiperplano Mi. Podemos 
aceptar, pues, que BÉ£M. En virtud del corolario 3. el hiperplano 
m-OB(O€ M) pasa por B y es paralelo a M. Si existe otro hi- 
perplano Y que pasa por B y tal que N||YWi, tenemos, según el 
corolario 2, N [|M-0B y entonces, en virtud del corolario 1,N y M-0B 
son incidentes. Pero los hiperplanos incidentes coinciden que es lo 
que se quería demostrar. 

TEOREMA 1 Si un hiperplano Y y un plano N de un espacio afín A 
no se intersecan, resulta que Y es paralelo a N. 

Queremos demostrar que £ (3) S L (PB). Supongamos, al contrario, 
que para unos puntos A, BEN el vector AB no pertenece a L (Y). 
Tomemos. un punto cualquiera O € Y (fig. 6) 

consideremos el vector OA . Puesto que 
$ es un hiperplano, se tiene 


L(0 =L(P)+L(AVB) 


y por ello para XEY y UE AVE conve- 
nientemente escogidos tenemos OA =0X — 
—AUT, de donde OU=0X y, por consi- 
guiente, U=X, lo que contradice a la con- 
dición de que BN =YW. 
TEOREMA 23. Para que dos planos M y N Fig. 6. 
que no se intersecan sean paralelos, es nece- 
sario y suficiente que uno de ellos sea un hiperplano en el espacio M V N. 
La suficiencia está contenida directamente en el teorema 1. 
Demostremos la necesidad. Sea L(N)<L(M) y sea AEN. Es sufi- 
ciente demostrar que RM Y R <= MI V A. El plano M V N está formado 
por aquellos puntos X que dependen linealmente de unos puntos 
A, Xi .... X, de Ñ y unos puntos Y,, ..., Y, de Wi. Es dectr, 


AX=MAY + MAY + AX + AX, = 
=AY +(4,+...+uJ4O+0Z (YEN y O, ZEM). 
Tenemos, por hipótesis, AY €L(N) = L(M) y, por consiguiente, 


AY =0U (U € M). De aquí se desprende que AX € L(MvV A) y por 
lo tanto XEM iv A. 
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COROLARIO 1. Si los planos Wi y N son de dimensión finita y no 
se intersecan, estos planos son paralelos cuando, y sólo cuando, 


dim. (M Y N) =máx (dim. N, dim. M+1. (1) 


La demostración es obvia. En particular, de este corolario sacamos 
la conclusión de que dos rectas que no se intersecan son paralelas 
cuando, y sólo cuando, se encuentran sobre un mismo plano bidi- 
mensional]. Análogamente, una recta y un plano bidimensional que 
no se intersecan son paralelos cuando, y sólo cuando, se encuentran 
en un mismo plano tridimensional, etc. 

COROLARIO 2. Cualquiera que sea el número finito k > 0, por todo 
punto B de un espacio afin U pasa un plano Y R-dimensional, y sólo 
uno, paralelo a un plano Rk-dimensional Wi dado de antemano. 

Podemos limitarnos a considerar el caso en que BÉ¿ WM. Debido 
a la fórmula (1), el plano PY debe ser un hiperplano del espacio 
Mv B y por ello el asunto se reduce al corolario 4 de la definición 
de los planos paralelos. 


29,4. Funcionales lineales. Una función f:91 > K, definida sobre 
e) conjunto de todos los puntos de un espacio afín A y con valores 
en el cuerpo conmutativo principal K, se Mama funcional sobre A. 


El concepto de una funcional sobre Y es un caso particular del concepto 
de una función que está definida sobre un conjunto arbltcadió y cuyos valores 
pertenecen a un Cuerpo conmutativo dado K. Para estas funciones hemos definido 
en el p. 4.1 los conceptos de una suma y de un producto de un número por 
una función, resultando que ei conjunto de todas las funciones forma, respecto 
a estas operaciones, un espacio lineal, cuya dimensión coincide con la potencia 
dei conjunto que sirve como el dominio de definición. 


Una funcional f, definida sobre un espacio afín YA, se llama 
lineal (o afin) sobre 9, si para cualesquiera O, P, Q, REA y A, 
p€ K que cumplen la relación 

OR =MP +00 (1) 
tiene lugar la igualdad 
HR) =MPICP)— HOY + (1 (Q)—Í (0) +1 (0). (2) 

Demostrermos que para toda funcional lineal f es válida la im- 

plicación 
XX = > AX LX > f(X)= pz AA) HAD) ERA), (3) 


cualesquiera que sean Xo, X,, ..., Xy XEA y A, ..., A,EK. 

Para s =2 la implicación (3) coincide la implicación (1) >(2) que 

define la linealidad de f. Aceptemos ahora por inducción que la impli- 
31 


cación (3) es válida para un valor fijo s > 2. Sea X.y= 2 A¡XoX,.Con- 
=l 
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siderando un punto X que cumple la condición X,X = 2 A/XoX ¡, obte- 
2) 


nemos (3). Después, de la relación X,Y =X¿X +2,+, XoXs.,, y dela im- 
plicación (1) => (2) obtenemos 


V= EOO FAY) HA EA 1) XRO = 
= DA HXDHX) +F(Xo) 


que es lo que se quería demostrar. 

Está claro que todas las funcionales constantes son lineales. Es 
también evidente que la suma de unas funcionales lineales y el 
producto de un número por una funcional lineal son de nuevo fun- 
cionales lineales. Por esto el conjunto de todas las funcionales li- 
neales sobre un espacio afín Y es un espacio lineal. Este espacio 
se indica por Y, y se lama conjugado de A. El conjunto de todas 
las funcionales constantes es un Su bempacio lineal de dimensión uno 
del espacio YA, 

LEMA. Si 4 es una funcional lineal sobre un espacio afin A y 
para unos puntos A, BEA se tiene f[(A) +f(B), entonces en la 
na AVB existe un punto X tal que f[(X)=0« cualquiera que sea 
aer. 

Tenemos para un punto arbitrario X€ AyB 


AX=%AB (AEK), (4) 
de donde, en virtud de (2), 


NX) =2(f (B)— HAD +1 (4). 
Por ello, tomando para A el valor 


A (a— HAD F(B)—(P(AY)"", 


obtenemos de (4) el punto requerido XEAVB tal que f(X) =a. 

TEOREMA 1 Para toda funcional lineal no constante f sobre un 
espacio afin A, el conjunto de los puntos XE€ AU en los que f toma 
un valor fijo UE K es un hiperplano de Á. Reciprocamente, para todo 
hiperplano M y cualquier € K existe una funcional tíneal f, cuyos 
valores son iguales a a sobre Wi y diferentes de « fuera de Mi. 

Demostremos la primera afirmación. Sea Mi el conjunto de los 
puntos XEA en los que f(X)=«. Puesto que la funcional f no es 
constante sobre YA, tendremos f(A)=>*f(B) para unos puntos A, 
BE€ MA convenientemente escogidos. Según el lema, de aquí se deduce 
que en la recta AVB existe un punto X perteneciente a Wi, de modo 
que el conjunto Wi noes vacío. Si Xp, X,, ..., X¿E€ NE y X es un 
punto que depende linealmente de éstos, se tiene 


HXJ=[(XJ=...=f(X)=a4 (S) 
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y para unos valores adecuados A,, ..., A¿,E K se tiene 
XA =4 XX E... PA XX» (6) 


De las fórmulas (6), (3) y (5) encontramos f(X)=a«, es decir, 
XEM. En otras palabras, el conjunto M es un plano de A. Resta 
demostrar que codim. W?=1. Como la funcional f noes constante, 

existe un punto A tal que f(4) +a y 

as 4 por ello AG Y. Tomemos un punto cual- 

3 quiera XEA y  demostrermos que 

XEAVM. SI FK(X)=a0, tenemos XEM 

y no hay nada que demostrar. Sea, 

mM Y > por esto, f(X)>+a y sea MEM. En la 

| recta AVM (fig. 7) existe, según el lema, 

Fig. 7. un punto B en el cual f(B)X<f(X) y, 

or ello, en la recta BVX existe un 

punto N EVI. Vemos que K depende linealmente de B y de N y 

que B depende linealmente de A y M. Luego, X depende lineal- 
mente de A, M y N y XEVIVA. 

Demostremos ahora la segunda afirmación del teorema. Sea 
A=MVA y sea MEM. Para todo punto XENA existe entonces 
una descomposición de tipo 


MX=14MA+ MU (MEeK y UEM) 


y sólo una. Introduciendo la funcional f,(X)=A, vemos que ella 
es igual a 0 sobre WM? y es diferente de O fuera de M y que la 
funcional [(X)=f,(X)+au es igual a a sobre Wi y es diferente de 
a fuera de Di. Por lo tanto, resta sólo demostrar que la funcional 
fo es lineal. Sea 


A + As XX, 


MX =0, MA + MU, (UE Mi; ¿¡=0, t, ..., S) (2) 
y, por consiguiente, f.(X)=a, ((=0, l, ..., s). Como X X= 


= MX,—MXo, de las fórmulas (7) obtenemos 
MX, =MX +22, (MX MX) =(2(4/0;—%0)-+ 00): MA+-MU, 
de donde 

fo (X,+1) == 24; É (X)—! (X0)) + f (X 4) 


que es lo que se quería demostrar. 

El conjunto de aquellos puntos XE€ A en los que la funcional 
dada f o el sistema de funcionales f, dado se anula se llama varie- 
dad radical de la funcional (o del sistema de funcionales). Por' 
esto el teorema | equivale a la afirmación de que la variedad ra- 
dical de una funcional lineal no constante es un hiperplano y de que 
todo hiperplano es la variedad radical de una funcional lineal ade- 
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cuada. Si la funcional es constante, su variedad radical es, obvia- 
mente, o bien vacía o bien coincidente con Y (funcional nula). La 
variedad radical de un sistema de funcionales es Ja intersección de 
las variedades radicales correspondientes a las funcionales del sis- 
tema dado. Por lo tanto, la variedad radical de un sistema arbi- 
trario de funcionales lineales es un plano (posiblemente vacío o 
coincidente con todo el espacio 2). 

Hemos demostrado en el p. 29.2 que todo plano Wi de codi- 
mensión finita s > 1 puede ser representado en la forma M=Y', N... 
...MPB,, donde YB,, ..., PB, son unos hiperplanos adecuados. 1n- 
dicando por f; la funcional lineal, cuya variedad radical es P,, ve- 
nes que M es el conjunto de aquellos puntos X € A, para los cua- 
es 


f,(X)=0, ..., f,(X)=0. (8) 
Considerando el problema recíproco, preguntémonos ¿para qué 
funcionales lineales f,, ..., f, la correspondiente variedad radical 


(8) resultará ser un plano de codimensión s? 

TEOREMA 2. Para que la variedad radical de un sistema de funcio- 
nales lineales f,, ..., f, sea un plano de codimensión s, es necesario 
y suficiente que las funcionales f,, ..., f, sean linealmente indepen- 
dientes (en U,) y que posean al menos un punto radical común. 

a Indiquemos por $, la variedad radical de la funcio- 
nal f/. Si 


EA) mA (A) hi (A) (XEM), 


se tiene B,N...N P,-,<R,. Luego, resulta que codim. (%,N...NY)= 
=Ccodim. (B,N...NPB,-,)es y, por consiguiente, las condiciones 
del teorema son necesarias. 


SUFICIENCIA. Tomemos 


M=B8,N-..NB,-,NP,- 
Tenemos, según el p. 29.2, codim. M<s. Supongamos que co- 
dim. M<s. Existen entonces en Y unos puntos Á 
tales que 


do vc. ..p. sS-] 


Az=MVAV..-VÁAs. (9) 
Consideremos todas las funciones definidas sobre el conjunto 
A. ..., As-,) con valores en un cuerpo conmutativo K. “Éstas 


unciones forman un espacio lineal, cuya dimensión es igual as—l, 
si los puntos A,, ..., A,., son diferentes, y es menor que s—1, 
si algunos de estos puntos coinciden. Es decir, el espacio de las 
funciones definidas sobre (4,, ..., As.,) es de dimensión no mayor 
que s—1 y por ello al menos una de s cualesquiera funciones de- 
finidas sobre el conjunto señalado puede ser expresada linealmente 
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en términos de las demás. En particular, si consideramos las fun- 
cionales f,, , fy sólo sobre el conjunto (A,, ..., Ay-,), una de 
ellas puede ser sin duda alguna expresada linealmente en términos 
de las restantes. Sea, por ejemplo, 


[¿(X) =a0P (0) +H 05-16, (A). (10) 

Esta igualdad es válida para todos los puntos X=A,,...,Aj;-,. 
Basándonos en que las funcionales consideradas son lineales y se 
anulan sobre el plano MH y empleando la relación (9), veremos fá- 
cilmente que la Igualdad (10) es válida para todos los puntos X € A, 
es decir, que las funcionales f,, ..., f, son linealmente dependien- 
tes y con ello queda demostrada la suficiencia de las condiciones. 


En efecto, de (9) se deduce que para todo punto X € A existen 
unos puntos O, YE€ MI y unos números A,, ..., As., tales que 


OX=204,+...+2;. DA, +07. 
luego, f,(0) =f,(Y)=0 y en virtud e (3) tenemos 
EA) =A FAA) A As ls) li=1, ..., 5) (11) 


Teniendo en cuenta que la ES (10) es válida para X=A), 
li=1, ..., s—1), obtenemos de (11) 


L00= DMA) =D A E cal (A) 
= E DAA) ho (MIA gata (0 


que es lo que se quería demostrar. 

COROLARIO 1 Supongamos que un plano M de un espacio afin YU 
es de codimensión finita s. Entonces el conjunto WiL de todas las 
funcionales lineales sobre U iguales a O sobre Wi, es un espacio ve- 
ctorial de dimensión s. 


Efectivamente, si Vil contiene unas funcionales f,, Pr Me 
nealmente independientes y si PH; es el hiperplano radical de la fun- 


cional f,, tenemos 
MSBN...NBs,, 


codim. Vi >s+ 1. 


En cambio, si todas las funcionales lineales de Vi se expresan 
linealmente en términos de f,, ..., f,_,, se tiene 


N=P,N ds Ns, 
y, por consiguiente, codim. WU <s— 1. 


COROLARIO 2. Para todo espacio afin Y la dimensión del espacio 
conjugado YU, es mayor en [ que la dimensión de A. 


y, por ello, 
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Sea D=(A/|1€ 1) una base de A y sea F una función cualquie- 
ra que está definida sobre BD y toma valores en K. Fijemos un 
punto cualquiera O€%. Para todo punto X€ A existe un sistema 
Anos --.» 44€ K definido univocamente que cumple la condición 


OX =»M 04A,, +... +A¿O0Á4. 
Definamos mediante la función F la funcional 
F(X) = 4, (F (Ar) —F (0) +E(0). 


Se comprueba fácilmente que la funcional f es lineal sobre %l 
y que F—»f es un isomorfismo del espacio vectorial de las funcio- 
nes, definidas sobre Y, sobre el espacio vectorial A,. Por lo tanto, 
la dimensión de 2, es igual a la potencia de la base B, es decir, 
es mayor en 1 que la dimensión de Y. 


Complementos y ejemplos 


1. Sea Y un espacio afín sobre un espacio vectorial L=L (A). Para todo 
plano 'M <=%, indlquemos por MM el conjunto de tas funcionales lineales sobre 

que son iguales a O sobre M. Recíprocamente, para todo conjunto 11 de 
funcionales lineales, Indiquemos por MY la variedad radical de ll. Entonces, 
para un espacio A de dimensión arbitraria es válida la siguiente [ey de dualidad: 
para todo plano no vaclo M<=Y se tlene (M4)T =M y la dimensión de M 
es igual a la códimensión de M2 en el espacio lines! A, de todas las funcio- 
nales lineales sobre Y. Reciprocamente, si un subespacio lincal U <A, no 
contiene funcionales constantes diferentes de cero, se tiene UT 9% gy, (UT) =u 


y la dimensión de M es igual a la codimensión de UT en Y. 

2. HOMOMORFISMOS DB ESPACIOS AFINES. Los espacios afines sobre un 
cuerpo conmutativo K son unas álgebras de signatura fija y, por ello, se puede 
hablar de Aomomorfismos, Se Hor y espacios cocientes de los espacios afines 
sobre K. Es fácil ver que siendo 8 una congruencia sobre un espacio afín YA, 
las clases de equivalencia según 8 son los planos que se obtienen uno de otro 
mediante traslaciones y que son, por ende, paralelos. Reciprocamente, si M es 
un plano, todos los planos paralelos a éste, que se obtienen de IR mediante 
traslaciones, forman el sistema de clases de equivalencia según una congruencia 
on a Y. La dimensión del espacio cociente A/8y es Igual a la codimen- 
sión de Mi. 


3. De los axiomas Aj, Az y As se ve que Ja clase de todos Jos espacios 
afines sobre un cuerpo conmutativo fijo K se define mediante identidades, es 
decir, que esta clase es una variedad de álgebras. Por ello se puede hablar de 
espaciós afines libres sobre un cuerpo conmutativo K provistos de un sistema 
dado de generadores libres. Puesto que una base de un espacio de dimensión 
finita es un sistema de generadores del mismo, el número de sus elementos 
disminuido en 1 coincide con la dimensión de A y como todos los espacios de 
una dimensión dada son isomorfos, todo espacio afín A sobre K es un espacio 
libre y los elementos de cualquier base de Y son los generadores libres de Y. 

4. Indiquemos por YWx B el producto cartesiano de los espacios ella 
A y B sobre un cuerpo conmmutativo fijo K (comprendido como el producto 
cartesiano de las álgebras U y B). Demuéstrese que el espacio vectorial de las 
traslaciones L (A x L) es isomorfo a la suma directa de los espacios £ (A) y L (B). 
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En partícular, un espacio afín de dimensión finita n es isomorfo al producto 
cartesiano de n espacios afines de una dimensión. 

5. Indiquemos por G el grupo de los automorfismos de un espacio afín Y. 
Para todo punto O E A indiquemos por Gp el conjunto de todos los automorfís- 
mos de Y que dejan inmóvil el punto O. Sea, finalmente, D el conjunto de 
todas las traslaciones de Y. Es fácil comprobar que Gp es un subgrupo de G y 

ue D es un subgrupo abeliano invariante de G. De acuerdo con el teorema 
del p. 29.1, tenemos la descomposición semidirecta 


G=00:D (Go N D=1), 


de la cual se deduce, en particular, que el grupo cociente G/D es isomorfo 
a Gu. Si el espacio A es de una dimensión, el grupo Gp es isomorto al grupo 
multiplicativo del cuerpo conmutativo K y es por lo tanto 
abeliano, mientras que el grupo GQ es metaabeliano. 
6. Compruébese, cn las notaciones del complemento 
anterior, la igualdad 


— —>r —— —> 
A0-Go90A=04-*.Gp:0A= Ga. 


7. Como hemos visto en el teorema 6 del p. 29.2, sj 
la característica del cuerpo conmutativo K es diferente de 
Fig. 8 2, todo conjunto M de puntos de un espacio afin sobre K 

que con dos cualesquiera puntos distintos suyos contiene 
también toda la recta que pasa por éstos, es un plano. Para cuerpos de carac- 
terística 2 esto, en general, no es válido. Sea K el cuerpo conmutatívo formado 
por dos elementos O y 1, sea L el espacio vectorial de da (x, y (e, E € K) 
y sea Y el espacio afin sobre L (fig. 8). Se comprueba fácilmente que Y tiene 
en total 4 puntos y 6 rectas. El conjunto M=4(0, 0), (0, 1), (1, 0) no es un 
lano, aunque con cualquier par de sus puntos contiene la recta que pasa por 
os mismos (que colncide con esto par). 


$ 30. Coordenadas afines 


30.1. Coordenadas de un punto. Sea 2 un espacio afin de dimen- 


sión finita n sobre un cuerpo conmutativo K. Según el p. 29.2, toda 
sucesión (Ao, A, ..-., An) formada por rn-+1 puntos linealmente 
independientes del espacio A se llama base de A. Una sucesión 
Ap U» ++ -» Un), formada por un punto cualquiera A,€ A y por 
unos vectores linealmente independientes U,, ..., U, del espacio 
vectorial L (AU), se llama base de referencia (hablando con más pre- 
cisión, base de referencia n-dimensional) de A. El punto A, se llama 
origen de la base de referencia. Está claro que a toda base 
(A. As, --., Ar) le corresponde la base de referencia (Aj, AJA), -.., 
..., AJÁA,) y que a toda base de referencia (A,, U,, -. - + Un) le cor- 
responde la base (A,, AU, -.-, AyUn). Por esta razón no se hace 
frecuentemente diferencia entre los conceptos de base y de base de 
referencia. 

Fijemos en el espacio 2 una base de referencia R=(0, 0A,,...,04,) 
que será llamada buse de referencia coordenada. Para todo X EA, su 
radio vector OX puede ser representado entonces univocamente en 
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la forma _ e 
OX=E-0A,+...+E"-04, (E'EK). (1) 

Los números ÉE!, ..., E” se llaman coordenadas del punto X en 
la base de referencia R (o en la base (O, A,, ..., An) y la fila 
Ex=(E, ..., E”) se llama fila coordenada del punto X en la base 
de referencia señalada. Estas coordenadas se llaman a veces coorde- 
nadas afines. Al cambiar la base de referencia coordenada (incluso, 
por ejemplo, al cambiar el orden en el que siguen los vectores), 
cambia también la fila coordenada del punto. La ley de variación 
será 2 más tarde, en el p. 30.4. 

Sean X,, X, y X, unos puntos arbitrarios del espacio. Se dice 
que el punto x divide al par de puntos (X,, X,) según la razón A 
(MEX), si XA, = XX X,. De aqui se deduce, en particular, que si 
el punto X, divide al" par de puntos (Xo, X,) según una razón 
determinada, los tres puntos se hallan sobre una misma recta. 
Recíprocamente, si los puntos X,, X,, X, se hallan sobre una misma 
recta y X, FX», el punto X, divide indudablemente al 1 par (X,, X,) 

ún la razón A=X,X,: X,X,, ya que los vectores X,X, y X,X, 
deben ser linealmente dependientes. 

¿Cómo ' determinar —dados el número 1€K y las cuordenadas 
(58 , ES) y (El, ..., El) de los puntos X, y X,— las coorde- 
nadas El, - .»» Er) del punto X, que divide al par (X,, X,) según la 
razón A? Tenemos, por hipótesis, 


OX =E-0A,+... +8104, ((=0, 1, 2), 


de donde 
X¡Xq41 52 0X 4 —0X == (Elyn —E7): OA, + Ps + (Ele —E2) OA). 
De la relación X,X,=4X,X, resulta 
—E) =4 (E —El) : 


El EA (U=l, ...,n). 


Está claro que el número dado A debe ser diferente de —1, ya 
que en el caso contrario de X,X,=—X,X, se tiene X,eX,. To- 
mando 4¿=1, obtenernos a Fórmulas 


y por ello 


.., 1) 


para las ia del 6 medio X del par (X,, X,). 
Veamos ahora cómo se rejleja la independencia "lineal de unos 


puntos arbitrarios X,, ..., X, del espacio Y en las filas coorde- 
nadas de los mismos. Sea 

OX ,=H-OA,+...+E5M0A, (i=1,..., 9, (2) 
de modo que (E), ..., €7) es la fila coordenada del punto X, en Ja 


23 -1843 
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base de referencia escogida. La independencia lineal de estos puntos 
equivale, por definición, a la independencia lineal de Jos vectores 


XX .-.. X¡X,. Tenemos de la igualdad (2) 
X,X¡=0X¡—0X,=(E)—E))-04, +... +(E—ED-04,, 
es decir, la fila (E! —E!, ..., E?—-E7) es la fila coordenada del 


PR 


vector X,X, en la base OA,, ..., 04,. Por esto el número máximo 
de puntos linealmente independientes del sistema X,, ..., X,, que 
se obtiene agregando ta unidad al número máximo de vectores 
linealmente independientes del sistema X,X,, ..., X,X,, es igual a 
EL—El ... EE 
1 + rango as =1+rango |18/-—Ef ||. 
n 


Es fácil ver que 


¡E 
EE... ERE a 
A 
l+rango | - - + + + + |=rango as 
Es —El .. ES—El LE... En 
Efectivamente, restando de la segunda fila, ..., de la n-ósima 


fila de la matriz del segundo miembro su primera (fila, no alteramos 
su rango y, por ello, 


E O + 4 
LEE OE. BIEN 

rango | . . . . |=rangf ........ 
LE... E O ElL—El... EL] 


=1+rango 18/—8l ll 
que es lo que se quería demostrar. 

Sea (E!, ..., E”) la fila coordenada de un punto X. Con frecuen- 
cia la fila (1, E!, ..., E”) suele llamarse entonces fila coordenada 
ampliada del punto X. El resultado que hemos obtenido puede ser 
expresado ahora en los términos siguientes: el número máximo de 
puntos linealmente independientes en el sistema X,, ..., X, es igual 
al rango de la matriz formada por las filas coordenadas ampliadas 
de los puntos de este sistema. 

En particular, para que los puntos X,, ..., An, Xn,, de un espa- 
cio afin de n dimensiones sean linealmente independientes es necesario 
y suficiente que 

LE... E 


2% o uo, 6) 
l A e... si 
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cer El, .... Ef son las coordenadas del punto X,(i=1, ..., 
n+|). 

El determinante que figura en (3) a la izquierda del signo + se 
llama a veces deferminante volumen del sisterna de puntos X,, ..- 
-.-» Any, Su anulación significa que los puntos X,, ..., X,,, se 
hallan sobre un mismo hiperplano del espacio Y. 

Hemos introducido en el p. 29.4 el concepto de una funcional 
lineal f(X) en un espacio afín A. Veamos cómo pueden expresarse 
los valores de esta funcional en términos de las coordenadas del 
punto X. Sea (El, ..., £”) la fila coordenada de un punto X en 
una base de referencia R=(0, OA,, ..., OA,). De (1) y de la 
relación que caracteriza la linealidad de f(X) obtenemos entonces 

NX) =0, 58 +4 ... + 4,5" +, (4) 
donde a,=f(A)—f(0) y a,=f(0) son unos números fijos que 
dependen solamente de la funcional f y de la base de referencia R. 
Viceversa, tomando unos números %, %.» .-.., %, € K totalmente 
arbitrarios y definiendo la funcional Í mediante la fórmula (4), po- 
demos comprobar fácilmente que f es lineal sobre A. 

Se dice que el polinomio a,E +... +0,” +0) en las variables 
El, ..., E” representa la funcional | en la base de referencia R. De 
lo expuesto se ve que Ja correspondencia entre los polinomios li- 
neales en n variables El, ..., E” y las funcionales lineales sobre A 
es biyectiva; además, si la funcional f está representada por el po- 
linomio a +...+0,5E"+0, y la funcional g por el polinomio 
pE+...+P,5"+8,, se tiene 


AMA) + pe (A) Ra + AB ERS.. +00, + mBr) E"+ da + uB.. (5) 


En otras palabras, poniendo en correspondencia a toda funcional 
lineal sobre Y el polinomio en ÉE!, ..., E” que la representa, ohte- 
nemos una aplicación isomorfa del espacio vectorial U, de todas 
las funcionales lineales, definidas sobre YA, sobre el espacio vectorial 
de todos los polinomios lineales (no homogéneos) en É', ... E” con 
coeficientes del cuerpo conmutativo principal K. 

De (5) se ve que las operaciones de adición de las funcionales 
lineales y de multiplicación de las mismas por un número se redu- 
cen a las operaciones correspondientes con las filas de coeficientes 
de los polinomios lineales. De aquí deducimos, en particular, que 
el número máximo de funcionales lineales linealmente independien- 
tes, contenidas en el sistema f,(X), ..., f,(X), es igual al rango 
de la matriz jormada por los coeficientes de las formas lineales que 
representan a las funcionales señaladas. 


30.2. Ecuaciones de planus. Aceptaremos que en un espacio A 
de n dimensiones sobre un cuerpo conmutativo K se ha fijado una 
hase de referencia R=(0, OÁ,, ..., OA,) y en lo sucesivo enten- 


aj 
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deremos por coordenadas de los puntos de Y las coordenadas de 
éstos en la base de referencia R. 

Sea P(E!, ..., E”) una condición que relaciona unos números 
arbitrarios El, ..., E” de K. Luego, para todo sistema concreto de 
valores de las variables E*, ..., E?EK la condición P puede ser 
verídica o falsa. Se dice que la condición P define en el espacio U 
un conjunto de puntos Mi, si cualquier punto X€ A pertenece a DI 
cuando, y sólo cuando, las coordenadas (E!, ..., E”) del punto X sa- 
tisfacen la condición P. 

De aquí resulta, en particular, que si las condiciones P (El, ... 


.., EN y Q(l, ..., E”) definen en el espacio A los conjuntos 
respectivos DM y NM, la conjunción de estas condiciones P(E!, ... 
A EN y Q(, ..., E”) define la intersección de los conjuntos 


señalados, la disjunción P o Q define la unión MuUN de los mis- 
mos y la negación no P define el complemento CM =ÚANM 

Sea f (Él, ..., E”) una función que está definida sobre K y toma 
valores en K. La condición de tipo 


(8, ..., 58%=0 (1) 
se llama ecuación en las variables E*, ..., E” y la conjunción de 
las ecuaciones 

FS, ...>, E”) =0 (=I, Le .... s) (2) 
se llama sistema de ecuaciones en las variables E!, ..., E”. Si el 


sistema de ecuaciones (2) define en el espacio A un conjunto Mi, 
se dice también que A es el sistema de ecuaciones para el conjun- 
to M. El conjunto M de puntos definido por el sistema de ecuaci- 
ones (2) es, según la observación hecha anteriormente, la intersección 
de los conjuntos definidos por cada una de las ecuaciones del sis- 
tema (2) por separado. 

En un cuerpo conmutativo arbitrario la condición af =0 equi- 
vale a la disjunción a=0 o P=0. Por esto, si las ecuaciones 


FE, ...,5)=0 y g(B. ..., E)=0 


definen (por separado) en el espacio Y los conjuntos respectivos UI 
y KR, la ecuación 

HE), ENE, -.., E)=0 (3) 
define en A la unión de los conjuntos M y R. 

Un conjunto Wi de puntos de un espacio afín Y se llama hiper- 
superficie algebraica, si existe un polinomio [(E', ..., E”) en las 
variables E!, ..., E” con coeficientes del cuerpo conmutativo K' tal 
que Wi se define por la ecuación (1) 

El grado del polinomio f respecto al conjunto de las variables 
El, ..., E” se llama grado de la hipersuperficie W?. Puesto que un 
mismo conjunto Wi puede tener varias ecuaciones diferentes, una 
misma hipersuperficie algebraica puede tener diferentes grados. Es 
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fácil darse cuenta, en particular, de que si una hipersuperficie tiene 
el grado ”, cualquier número mayor también es grado de ella. El 
menor de los grados de una hipersuperficie algebraica dada se llama 
orden de la misma. 

Como el grado de un producto de polinomios es igual a la suma 
de los nacos de los factores, de la fórmula (3) se deduce que !la 
unión de unas hipersuperficies algebraicas de ordenes s y f es de 
nuevo una superficie algebraica de orden no mayor que sf. 

Se dice que una hipersuperficie algebraica Y se descompone, 
si es la unión de dos hipersuperficies algebraicas no vacías diferen- 
tes de la dada. 

La intersección de un número finito de hipersuperficies alge- 
braicas se llama variedad algebraica. 

Los conceptos de hipersuperficie algebraica y de su orden han 
sido definidos mediante el tipo de las ecuaciones a las que satis- 
facen las coordenadas de un punto arbitrario de la hipersuperficie. 
Al cambiar la base de referencia coordenada, también cambiarán 
las coordenadas del punto y con ellas las ecuaciones del conjunto 
considerado. En lugar de hipersuperficie algebraica de orden s, sería 
más correcto hablar por esto de una hipersuperficie algebraica de 
orden s en una base de referencia coordenada dada y, análogamente, 
de la descomposición en la base de referencia coordenada dada, etc. 
Sin embargo, demostraremos en adelante que la propiedad de un 
conjunto de ser una hipersuperficie algebraica de un orden dado no 
depende, de hecho, de la selección de la base de referencia coor- 
denada. 

Las propiedades de las variedades algebraicas arbitrarias cons- 
tituyen el tema de estudio de una asignatura especial, ta Geome- 
tría algebraica. En este libro serán estudiadas solamente las hiper- 
superficies de primer orden (los hiperplanos) y sus intersecciones 
(los planos). 

Es poco cómodo que las definiciones de algebraicidad y de orden 
dependan, como hemos señalado, de la selección de la base de re- 
ferencia coordenada. Para deshacerse de esta dependencia se emplea 
el siguiente procedimiento. Sea f(X) una funcional dada en un es- 
pacio afín A de dimensión n. Escojamos en 9 una base de referencia 


coordenada cualquiera R=(0, OA,, .... OA,) y pongamos en co- 
rrespondencia a toda sucesión E!, ..., ¿” de números de K el número 


f(E%, ..., E”) igual a f(X), donde X es el punto de coordenadas 
El, ..., E”. Resulta así que a toda funcional se le pone en corres- 
pondencia una función en n variables E!, ..., E” que representa 
a la funcional f en la base de referencia coordenada dada R. Recí- 
procamente, definiendo para la función f(E!, ..., E”) la funcional 
[(X) mediante la igualdad 


FAO)=[f/(E, ..., E, 
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vemos que cualquier función en n variables representa a una fun- 
cional en la base de referencia señalada. Está claro que la variedad 
radical de la funcional f(X), compuesta de aquellos puntos X € A 
ara los cuales f(X)=0, coincide con el conjunto que la ecuación 
F (El, ..., E) =0 define en la base de referencia ccordenada dada. 
Sin embargo, en la definición del concepto de una jincional y de 
su variedad radical no figuran las bases de referencia coordenadas 
y, por ello, es preferible representar las ecuaciones de un conjunto 
de puntos en la forma f(X)=0, donde f es una funcional. ¿Cómo 
entonces caracterizar aquellas funcionales cuyos valores se represen- 
tan por polinomios? La respuesta es la siguiente. Hemos visto ya 
en el p. 30.1 que los polinomios lineales representan a las funcio- 
nales lineales. Consideremos ahora las funcionales F(X,, ..., X,) 
en s puntos variables. Una funcional F(X,,..., X,) se llama Lineal 
respecto al i-ésimo argumento X;, si se convierte en una funcional 
lineal en X, para cualesquiera valores fijos de las restantes va- 
riables. Una funcional F(X, ..., X,) se llama polilineal si es lineal 
respecto a cada uno de sus argumentos. Hemos llegado ahora al 
momento central: una funcional f(X) en una variable X se llama 
funcional (o forma) de orden s (o de grado s), si existe una funcio- 
nal polilineal F(X,, ..., X,) en s variables tal que 


HA)=SF(X, ..., X). 


Se comprueba fácilmente que habiendo sido fijada una base de 
referencia coordenada cualquiera, la funcional f(X) es de orden s 
cuando, y sólo cuando, sus valores se representan por un polinomio 
adecuado de orden s en las coordenadas del punto X. La demos- 
tración la omitimos aquí debido a su evidencia. 

Después de estas consideraciones generales pasamos ahora al 
problema principal de este parágrafo que es el estudio de las ecua- 
ciones de los planos. 

Supongamos, pues, que en un espacio afín dado de dimensión 
finita n se ha fijado una base de referencia coordenada arbitraria 


R=(0, OA,, ..., OA,). Una ecuación de primer grado en las va- 
riables E*, ..., E” es una ecuación de tipo 
a5l +...+ ab” =B, (4) 


donde al menos uno de Jos coeficientes «a,, ..., a, es diferente de 
cero. Introduciendo la funcional 


FO =a, + ... + a,5" —f, 
vemos que el conjunto de puntos Wi representado por la ecuación 
(4) es la variedad radical de la funcional f(X). La funcional f (X) 
es, según el p. 30.1, lineal y no es constante, de modo que Mi es 
un hiperplano en 2. Luego, «na ecuación lineal arbitraria en unas 
variables El, ..., E” representa un hiperplano en un espacio afin. 
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Consideremos un sistema cualquiera de ecuaciones lineales 
ata 05 =P, 
apart. abr = PS. 

Indicando por WM, el conjunto de los puntos cuyas coordenadas 
satisíacen la ¿-ésima ecuación de (5), vemos que el sistema de ecua- 
ciones (5) define la intersección de hiperplanos M=WM3M,N...NVi,. 
Según el p. 29.2, esta intersección o bien es vacía o bien es un 
plano cuya codimensión no pasa de s, de modo que la dimensión 
de Mi es no menor que n-—s. ¿Cuál es el valor exacto de la dinien- 
sión de Wi? 

Introduzcamos las funcionales lineales 


F(A)=aE ++. +apEn—P! (i=1l, ..., 5). 


Et plano Mi es la variedad radical del sistema de estas funcio- 
nales. Si Visa ZW, la dimensión de Di es igual, por lo visto en el 
teorema 2 del p. 29.4, al número máximo de funcionales Jineal- 
mente independientes en el sistema f,, ..., f,, es decir (véase el 
p. 29.4), la dimensión de Mi es igual al rango de la matriz || a || 
formada por los coeficientes de las variables del sistema de ecua- 
ciones (5). 

Resta aclarar en qué caso M= Y y en qué caso Vi Y, es 
decir, bajo qué condiciones el sistema (5) es compatible. Pero la 
respuesta a esta última pregunta viene dada por el teorema de 
Kronecker —Capelli (véase el p. 5.3): para que el sistema de ecua- 
ciones (5) sea compatible es necesario y suficiente que el rango 
de la matriz principal de este sistema coincida con el rango de su 
matriz ampliada. Hemos obtenido de esta forma el teorema siguiente: 

TEOREMA. En un espacio afin YU de n dimensiones todo plano 
(n —r)-dimensional (0U<r<n) M puede ser representado, en cual- 
quier base de referencia coordenada, por un sistema de ecuaciones 
de tipo 


(S) 


dadEi+att+... far =P (i=l, ..., 1) (6) 


tal que el rango de la matriz principal || a%|| es igual a r. Un 
sistema arbitrario de ecuaciones lineales de tipo (4) representa en A 
un plano (n-—r)-dimensiunal siempre que los rangos de las matrices 
principal y ampliada del sistema (4) coincidan y sean iguales a r. 
En cambio, si dichos rangos son diferentes, el sistema (4) es incom- 
patible y, por consiguiente, representa el plano vacio. 

Consideremos el problema siguiente. Dadas las filas coordenadas 
(B), ..., B?) de unos puntos B, (¿=0, l, ..., s) de un espacio Y, 
hallar la ecuación del plano mínimo Ni =B, Y B, Y ... V B, que pasa 
por los puntos dados. 
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Resolvámoslo primero en la forma vectorial. El plano Wi se com- 


pone, según el p. 29,2, de los puntos X € A tales que el vector B,X 
puede ser representado en la forma 


B,X =4,B,B, + ... +ABAB, (A, ...o, As € K), 
es decir, 
OX =1,(08,—0B,)) +... +4, (0B,—0B,) + 0B.. (7) 


La ecuación (7) se lama a veces ecuación de un plano en la 
forma vectorial paramétrica. Introduciendo aquí en Jugar de los 


radios vectores OX y OB, sus filas coordenadas correspondientes, 
obtenemos las relaciones 


E = (PB PBDA +. + (Bs —Bo)A HB (i=1, ..., n). (8) 


Poniendo fB—P! = y), podemos representar estas relaciones en 


la forma 
ESPA +... FYA FB (i=1, ..., 1), (9) 


que expresa las coordenadas de un punto arbitrario X E Mi en tér- 
minos de los parámetros independientes auxiliares A,, ..., A,. Las 
ecuaciones (9) se llaman ecuaciones coordenadas paramétricas del 
plano M. Puesto que Mu=B, VB, V ... VB,, la dimensión de DM 
es igual al múmero máximo de puntos linealmente independientes 
que figuran en el sistema B,, B,, ..., B, disminuido en 1, es 
decir, es igual al rango de. la matriz C=||y;l] formada por los 
coeficientes de las variables A,, ..., A, de las ecuaciones paramé- 
tricas. 

Para obtener de las ecuaciones paramétricas (9) de un plano Vi 
sus ecuaciones generales de tipo (S), es suficiente eliminar del 
sistema (9) los parámetros A,, ..., A,. Esto se puede hacer, por 
ejemplo, del modo siguiente. Buscamos el rango de la matriz |] Y IN 
Supongamos que éste es igual a r; luego, entre las ecuaciones (9) 
existen unas ecuaciones [,-ésima, ¿,-ésima, ..., ),-ésima y entre 
los parámetros A,, ... A, existen unos parámetros A;, ..., Á 


i, 

(¡<< ij 1 <... <],) tales que det lv | 340. Resolviendo 
estas ecuaciones respecto a las incógnitas A;, ..., Aj, Obtendre- 
mos para éstas unas expresiones lineales en términos de £,, ..., É, 
y de los restantes parámetros A, (¡É4i, ..., ¡,)). Introduzcamos 
ahora los valores obtenidos de los parámetros en cada una de las 
ecuaciones restantes del sistema (9). Obtendremos asi unas relacio- 
nes lineales entre las variables E,, ..., E, y los parámetros 4), 
tr --., 1,). Los parámetros 4, aparecerán, de hecho, en estas 
relaciones con coeficientes nulos (debido a que r es el rango de la 
matriz Ny I) y, por ello, las relaciones obtenidas serán unas rela- 
riones de tipo (5) que representarán el plano MI. 
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En los razonamientos realizados hemos supuesto que O <r < n. 
Si r=n, el plano Wi pasará por n+-1 puntos linealmente indepen- 
dientes y coincidirá con todo el espacio Y; si se quiere, su «ecua- 
ción general» puede ser representada en la forma 


0-E+...+0:=0. (10) 


Consideremos el problema recíproco: ¿cómo hallar las ecuaciones 
paramétricas de un plano MM dado por unas ecuaciones generales 
de tipo (5)? Supongamos que la dimensión de Wi es r <n. El 
sistema (5) contiene entonces sólo r ecuaciones independientes y los 
coeficientes que tienen en estas ecuaciones unas r variables forman 
una matriz de determinante diferente de 0. Supongamos, para conc- 
retar, que son independientes las r primeras ecuaciones y que es 
diferente de cero el determinante formado por los coeficientes de 
las variables E*, ..., E”. Resolviendo las r primeras ecuaciones 


respecto a Jas variables E!, ..., E”, obtendremos entonces un sistema 
de ecuaciones de tipo 
EFE MEE (i=l, ..., 7) (11) 


equivalente al sistema (9). Está claro que el sistema (11) es equi- 
valente a las ecuaciones paramétricas 


Ed A AB ib, 1), 
Uh, li=r+1l, ..., a). 


Hemos considerado detalladamente el problema de la determi- 
nación de las ecuaciones del plano mínimo que pasa por los puntos 
dados. Está claro que dicho problema representa un caso Daricular 
de un problema más general sobre Ja determinación del plano 
mínimo que pasa por los planos dados M y NM. Sin embargo, este 
problema más general puede ser reducido de un modo formal al 
primer problema. En efecto, los planos Di y 3 pueden ser repre- 
sentados en la forma + 


M=B.V BV... VB, (dim.M = 5), 
R=C.VC,V... VC, (dim.N= 1), 


donde Bo, B,, ..., B, son unos puntos linealmente independientes 
de VW y Co, C,, - ., C,¿ son unos puntos linealmente independien- 
tes de M. Entonces 


MvN=B,V... VB, VWCIV... WC; 


y el problema ha quedado reducido a la determinación del plano 
mínimo que pasa por los puntos Bo, ..., By, Co, ..., C¡- ¿Cómo 
determinar los puntos B,, ..., B, si el plano Wi viene dado por 
sus ecuaciones generales de tipo (5)? Uno de los métodos (que no 
es el más breve) es el siguiente. Reducimos el sistema (5) a iu 
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forma (11). Indudablemente podemos tomar entonces para los pun- 
tos B, los puntos de las filas coordenadas siguientes 


(Bo) =(P', B?, A | pr, 0, O, ey o, 

(B,) e (Pp! + Preso BrYrs r...qy PB" + Vet 1, 0, .. 44 O), 

(B,) = (p' + Ya. Bb Yes E P + Vos. O, 1, ..., 0), 

Bl=Br Ber BEA 0,0, ..., 1) 
(s+r=>n). 


Consideremos otro problema particular. Supongamos que en un 
espacio YU se ha escogido una base de referencia coordenada 


R=(0,04A,, ..., OA,). Los planos de tipo O V A;, V ... V As, 


(1<i<... <1, Xn) se llaman entonces planos coordenados r-di- 
mensionales. Poniendo 

el VA VAnmiV o... VÁn (12) 
vemos que R 3 son todos fos aia coordenados 


posibles. De qa dd que un punto X de coordenadas (E, ...,É”) 
pertenece a cuando, y sólo pta 


El = (13) 

En otras palabras, la ecuación y es la ecuación del hiperplano 

$, El plano coordenado O V A,, V ... V As, =M es la intersección 

de Je los hiperplanos $, que tienen el índice diferente de 

i p Por esto las ecuaciones del plano MM pueden ser repre- 
adas pa la forma 

E=fP=...=E=>0, 
donde a, B, ..., y €es la sucesión de aquellos números naturales 
del conjunto 1, 2, ..., n que no figuran en el conjunto fi,, .. od. 


Por ejemplo, las ecuaciones del ¿-ésimo eje coordenado OVA 
pueden ser representadas en la forma 


Eo. tutti, =En=0, 


A título de ilustración consideremos el siguiente ejemplo numé- 
rico. En el espacio afín R* corriente real de tres dimensiones está 
dada mediante dos ecuaciones 


42 P=1, 
E! + 25? — 26? = 2 
una variedad lineal Ni. 
¿Cuál es la dimensión de MM? Componiendo la matriz ampliada 


de este sisluma 
1211 
122 2/» 


(14) 
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vemos que contiene un determinante de segundo orden diferente 
de cero, cuyos elementos están indicados con las cifras gruesas. 
Es más, este determinante pertenece a la matriz principal del sis- 
tema. Por esto el rango de la matriz ampliada, que es igual a dos, 
coincide con el rango de la matriz principal. De aquí sacamos la 
conclusión de que la codimensión de Wi es igual a 2 y de que la 
dimensión de Wi es igual a 1, es decir, M es una recta. 
Resolviendo el sistema (14) respecto a E! y E?, encontramos 


P=-=l, 
1 = —2E2. 


Podemos aceptar aquí que 2 es un parámetro, de modo que (15) 
puede ser considerado como las ecuaciones paramétricas de la 
recta Mi. Dando al parámetro E? los valores O y 1, obtenemos 
de (15) que los puntos de coordenadas (0, 0, —1) y (— 2, 1, — 1) 
se hallan sobre la recta Wi. 

Consideremos otro ejemplo. ¿Qué conjuntos de puntos del espa- 
cio R* son representados por las ecuaciones 

a) EE =0, 

b) (Ey — EE YE? +8 —E? 4 E? = 02 

Está claro que en el caso a) el conjunto incógnito es la colec- 
ción de los tres hiperplanos coordemados de ecuaciones 1) E! =0, 
2) E2=0 y 3) E*:=0. En el caso b), el primer miembro se descom- 
pone en los factores El4+-3) y E! —E2?+48É* y, por ello, el conjunto 
incógnito es la colección de los hiperplanos de ecuaciones $! +1=0 
y PY —E+E=0. 


30.3. Ecuaciones de hiperplanos y de rectas. Queremos exami- 
nar aqui más detalladamente las ecuaciones de los hiperplanos y de 
las rectas, así como las condiciones de paralelismo de los mismos, 
expresadas en la forma coordenada. 

TEOREMA 1. Todo hiperplano de un espacio afin de n dimensiones 
puede ser representado mediante una ecuación de primer grado 


abit... +0." +0 =0. (1) 


Para que un hiperplano representado por la ecuación (1) coincida 
con un hiperplano representado por la ecuación 


BS +... +8B,5"+Bo=0, (2) 


es necesario y suficiente que sean proporcionales los coeficientes co- 
rrespondientes: 


(15) 


A y 


a _ —= 4 — o 
A eS 19) 


Los hiperplanos representados por las ecuaciones (1) y (2) 
son paralelos cuando, y sólo cuando, sus respectivos coeficientes 
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principales son proporcionales: 


a (4) 

El teorema contiene tres afirmaciones. La primera ha sido ya 

demostrada en el p. 30.2. Para que Jos hiperplanos (1) y (2) coin- 

cidan es necesario y suficiente que el conjunto de las ecuaciones 

(1) y (2) defina un hiperplano. Esto equivale, según el teorema 
del p. 30.2, a que 


[57 Ln Lol _y 
e089 lp, ... Bn Boj” 


y esto significa precisamente que tiene lugar (3). 

Los hiperplanos (1) y (2) son paralelos, si coinciden, y enton- 
ces tenemos (3), o si no se intersecan. En el último caso las ecua- 
ciones (1) y (2) deben ser incompatibles y por esto, según el teorema 
de Kronecker—Capelli, se tiene 


rango [% --- pr] =1, 

> [$ eS B, 

es decir, se tiene (4). Luego, la condición (4) es verídica en ambos 
casos. 

Consideremos el problema: dada la ecuación (1) de un hiper plano Y 
y las coordenadas El, ..., E3 de un punto A, hallar la ecuación del 
hiperplano que es paralelo a HB y que pasa por el pto A. 

Sea (2) la ecuación del hiperplano PHP” que buscamos. Puesto 
que este hiperplano es paralelo al hiperplano (1), deben cumplirse 
las condiciones (4). Por esto multiplicando la ecuación (2) por un 
coeficiente de proporcionalidad adecuado, podemos representar la 
ecuación del hiperplano que buscamos $” en la forma 


a1E! +... + 055" +B0=0. (5) 
El punto A se halle, por hipotesis, sobre P”, Por ello 
aabt... +00 + Po =0. (6) 


Restando de (5) término por término (6), obtenemos la ecuación 
deseada 


a (—5) +... +0, (5 —E5) =0. 


Fstá claro que el hiperplano definido por la ecuación (1) pasa 
por el origen (0, ..., 0) de la base de referencia coordenada cuando, 
y sólo cuando, «a,==0. Consideremos el caso en que a, +0. Divi- 
diendo por —«a, todos los coeficientes de la ecuación (1), podemos 
reducirla a la forma 


Eto ml, (7) 
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Los números Y,, ..., Y, admiten una interpretación geométrica 
simple. Efectivamente, busquemos el punto de intersección del 
hiperplano (7) y del eje coordenado OV A,. Las ecuaciones de este 


eje son 
Est... =ElafótHs=,,,=af=0, (8) 


Resolviendo conjuntamente (7) y (8), obtenemos E'=y,. Por 
consiguiente, el hiperplano (7) intercepta en el eje OVA, el vec- 
tor yOA,. Por esta razón la ecuación (7) suele llamarse general- 
mente ecuación segmentaria de un hiper plano. 

Examinemos también el siguiente problema: ¿bajo qué condicio- 
nes la ecuación (1) representa un hiperplano que pasa por el plano 
coordenado OVA, V...VA,(l<r <n)? Este plano esta formado 
por los puntos de coordenadas ir 0 , 0). Introduciendo 
estas coordenadas en la ecuación (1, obtenemos a tt+ - +0 + 
+0,=0. Esta relación debe satisfacerse para calequler lores 
de los números E!, ..., E” del cuerpo conmutativo K. Por consi- 
guiente, 4,=...=0, ee % 02 0, Analogamente se comprueba que el 
hiperplano (1) pasa por el plano coordenado r- dimensional OVA, V.. 

. VA:1,, cuando, y sólo cuando, a; =... =4;, =0, =0, 

“Manteniendo invariables en la ecuación (1) los coeficientes prin- 
cipales %,, ..., %, y dando diferentes valores al término indepen- 
diente a,, obtenemos ecuaciones de hiperplanos paralelos. Por esto, 
si en la ecuación (1) se tiene ay, =...=0%,=0, mientras que el 
término independiente a, es arbitrario, el hiper plano (1) es paralelo 
al plano coordenado OV A,,V ...V Ar,. En particular, el hiperplano (1) 
es paralelo al eje coordenado OVA, ¡ cuando, y sólo cuando, a, =0, 
es decir, cuando la ecuación (1) no contlene explícitamente la 
(-ósima coordenada. 

Como sabemos, por cualesquiera n puntos linealmente indepen- 
dientes B,, ..., Ba de un espacio afín de n dimensiones pasa un 
hiperplano B,V. Y B, y sólo uno. ¿Cómo escribir la ecuación de 
este hiperplano, si se conocen las filas coordenadas de los puntos 
B., B,? Supongamos que (B!, ..., BD, ..., (Bl, ..., bn) son 
las filas coordenadas de los puntos B,. ..., B,. Para que un punto 
arbitrario X de coordenadas ÉE!, ..., En se halle sobre el hiperplano 

BV... VB, es necesario y suficiente que el sistema de puntos 
X, B,, , B, sea linealmente dependiente. Según el p. 30.1, el 
sistema de. puntos señalado será linealmente dependiente cuando, 
y sólo cuando, las coordenadas de estos puntos satisfacen la condi- 
ción 


Po +. Bo, (9) 
Br... Ba 
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Desarrollando el determinante según los elementos de la primera 
fila, vemos que la ecuación (9) es lineal respecto a las variables 
El, ..., E” y, por ello, representa el plano deseado. a 

El término independiente de la ecuación (9) es igual a det |] P! ¡]. 
Por consiguiente, el hiperplano que pasa por los puntos linealinente 
independientes B,, ..., B, pasará por el origen de coordenadas 
cuando, y sólo cuando, det || B!|j-=0. 

Consideremos ahora más detalladamente las ecuaciones de las 
rectas. Supongamos dado en un espacio afín YA de n dimensiones 
un par de puntos diferentes B, (BI, ..., B3) y B, (B!, ..., B7), donde 
se indican entre paréntesis las coordenadas de estos puntos en una 
base de referencia coordenada fija R=(0, OA,, ..., OA,). El 
punto X pertenece a la recta B,V B, cuando, y sólo cuando, existe un 
número A tal que B,A =4B,B,, es decir, cuando 


EP =MBBD (i=1, ..., nm). (10) 


Determinando A de cada una de las ecuaciones (10) e igualando 
los resultados, obtenemos 


El—f0 _ E%—83 _ eS En —Po j (11) 
Bi—PBs  Bi—Bo Bi—Bo 

Reciprocamente, siendo É!, ..., E” las coordenadas de un punto X 
que satisfacen las igualdades (11) e indicando por A el valor común 
de las razones (11), obtenemos (10), de modo que X€ B,VB,. Por 
consiguiente, las ecuaciones (11) son las ecuaciones de la recta que 
pasa por dos puntos dados. 

Notemos que en las razones (11) algunos de los denominadores 
pueden anularse. Puesto que queremos que las relaciones (11) sean 
Ea sal a las condiciones (10), debernos tomar E'- Pf = 0 siempre 
que P, —P), =0. 

Poniendo B¡—P =p! y BI=P", podemos representar las ecuacio- 
nes (11) en la forma 

E-P 2-8 O id 
A 

Los números p!, ..., u” se llaman coeficientes directores de la 
recta y las ecuaciones (12) se llaman ecuaciones de la recta en coe- 
ficientes directores. 

TEOREMA 2. Para que la recta (12) sea paralela a la recta 
ln t_ y? ”n_ 


yl yt 


(12) 


es necesario y suficiente que sus coeficientes directr res sean propor- 
cionales: 


cs er (14) 
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Las rectas (12) y (13) coinciden cuando, y sólo cuando, se cum- 
plen las condiciones de proporcionalidad (14) y las condiciones 


o ON ia 0 in de 
O ya as ya» 
que significan que el punto de coordenadas f*, ..., f” que perte- 
nece a la recta (12) se halle sobre la recta (13). 
De las ecuaciones (12) se ve que los puntos B, (P', ..., B”) 


y B,(P+p!, ..., P?4p”) se hallan sobre la recta que representan 
estas ecuaciones. Análogamente, sobre la recta (13) se hallan los 
puntos C.(Y, ..-, Y) y C,(Pp+wv,..., y” +.w”. Según el p. 29,3, 
las rectas B¿VB, y C¿VC, son paralelas cuando, y sólo cuando, 
se tenga C,¿C, =4B,B, para un AEK, es decir, cuando las coorde- 
nadas de los vectores B,B, y C,C, sean proporcionales. Puesto que 
las coordenadas de estos vectores son iguales, respectivamente, 
ap, ..., pp” y vi, ..., v”, obtenemos de aquí (14). Como para 
la coincidencia de Jas rectas es suficiente que tengan un punto 
común y que sean paralelas, la segunda afirmación del teorema 2 
se desprende directamente de la primera afirmación. 

Además de las ecuaciones de tipo (13), una recta en un espacio 
afín de n dimensiones puede ser definida también mediante un 
sistema general de ecuaciones lineales de tipo 


a+... oir a=0 (=1, ..., s), (15) 


donde los rangos de la matriz principal y de ta ampliada son iguales 
a n—l. ¿Cómo conociendo las ecuaciones de una recta en la forma 
general (15) hallar sus ecuaciones en la forma canónica (13)? Para 
ello es suficiente hallar las coordenadas de dos cualesquiera puntos 
diferentes de la recta (15) y recurrir después a la fórmula (11); 
pero se puede proceder también del modo siguiente. El rango del 
sistema (15) es, por hipótesis, igual a n—1. Luego, n—1 coorde- 
nadas variables, digamos E, ..., E””*, pueden ser expresadas me- 
diante la restante coordenada variable E”. Así obtenemos unas 
expresiones de tipo 


En ple? Bl (i=1, .... n—1), 


de donde 
El — fl NN En -1—_fin—-1 En 
NT o... 25 ETT id 


Estas serán precisamente las ecuaciones eanónicas de la recta (15). 

Para concluir determinemos las condiciones de paralelismo de 
una recta y de un hiperplano en la forma eoordenada. 

TEOREMA 3. Un hiperplano dado mediante la ecuación 


a, bt... +05" +%=0 (16) 
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es paralelo a una recta dada mediante las ecuaciones 


¡incl EQ (17) 
Y Y 
cuando, y sólo cuando, 
apply... +0, =0, (18) 
Indicando por A el valor común de las razones de (17), obte- 
nemos 
Espr+p! (í=1, ..., a). (19) 


Introduciendo en (16) estos valores en lugar de las coordenadas 
variables E', llegamos a la ecuación 


(a, +... +0) ¿== — (a, Pl +... +0,P” +). (20) 


Si resulta que ap! +... + an” 3 0, encontraremos primero de 
(20) un valor único para A y, después, de (19) unos valores, tam- 
bién únicos, para las coordenadas E' del punto de intersección de 
la recta (17) y del hiperplano (16). Por consiguiente, en este caso 
la recta y el hiberplano son, sin duda alguna, no paralelos. 

Sea ap! +... a,u”=0. Si el segundo miembro de (20) es dife- 
rente de cero, la ecuación (20) no tiene soluciones para A, la recta 
(17) y el hiperplano (16) no se cortan de por ello, son paralelos. 
Por otra parte, si el segundo miembro de (20) es igual a cero, la 
ecuación (20) se cumple para cualesquiera valores de A, es decir, 
todos Jos puntos de la recta se hallan sobre el hiperplano y, por 
consiguiente, la recta y el hiperplano son de nuevo paralelos. 


30.4. Transformación de coordenadas afines. ¿Cómo varían las 


coordenadas El, ..., E” de un punlo arbitrario X de un espacio 
afín Y de n dimensiones, sí pasamos de la base de referencia coor- 
denada fija R=(0, OÁ,, ..., 0A,) a otra base de referencia 
R'=(0", OA, .... O'A,)? Consideremos primero el caso en el 


que la base de referencia R' se obtiene de la base de referencia R 


mediante una traslación determinada por el vector 00”. En este 
caso se tiene 


0'A,=04, (i=l, ..., n). (1) 

Tenemos, por hipótesis, 
OX =E-DA +... +E"-04,, (2) 
indicando por a!, ..., a” las coordenadas del origen nuevo O' 
(en la base de referencia “antigua” R) y por E", +..., E” las 


coordenadas nuevas del punto X (en la base de referencia R”), 
obtenemos 


00'=a'.04,+... +a"-ÓA,, (3) 
OX =E LOA... E2 .0"Ar. (4) 


$ 30. Coordenadas afines 369 


Sumando término a término las igualadades (3) y (4), emplean- 
do las relaciones (1) y comparando el resultado obtenido con las fór- 
mulas (2), llegamos a las fórmulas que buscamos 


E=sE Ya (i=l, ..., n) (5) 
que representan la ley de transformación de las coordenadas en una 
trastación del origen. 

Consideremos ahora el caso en el que el origen de la base de 
referencia coordenada nueva coincide con el origen de la base de 
referencia antigua. Los sistemas de los vectores coordenados OA, 

., OA, y 0'A;. ..., 0'A;, representan dos bases del espacio 
vectorial L (A), de modo que los vectores coordenados nuevos O'A; 
pueden ser expresados mediante los antiguos por fórmulas de tipo 


07,9 DA, +... +3: 0, y 
G=l, ..., m, 


donde el determinante de la matriz T =||vw)|] es diferente de cero 
(p. 8.3). 

Observando que O=0”, introducimos en la fórmula (4) las 
expresiones (6) en Jugar de los vectores OA;. Comparando el resul- 
tado de la sustitución con la igualdad (2), 
legamos á las relaciones 


Ei=EU RE. FEA, (i=1l, ec n) A; ñ 
que pueden ser representadas brevemente y, Al Á, 
en la forma matricial conocida AO 

(cr BS. EA. A) 0 7 

Finalmente el paso de una base de en 
referencia R=(0, OA,,..., O0A,) a otra g- 9. 
base cualquiera de encia R'=(0',0'A;, 

, O'A;) puede ser realizado en dos pasos (véase la fig. 9 para 
el caso en el que n=2): 1) trasladamos la base de referencia íni- 
cial en el vector 00”, obteniendo así una base de referencia R” de 
origen en el punto O” y 2) pasamos de la base de referencia R* a 
la base de referencia R*” sin cambiar el origen de coordenadas. 


Empleando sucesivamente las fórmulas (5) y (7), obtenemos las 
relaciones definitivas 


Az 


O e E A 0 E E CLA E (8) 
donde 7 =||*, || es la matriz del cambiv de la base 0A,, ..., OA, 
por la base 0'A;, ..., O'A; (que está formada por los coeficientes 
de las expresiones lineales de los vectores O'A;¡ en términos de los 
vectores OA, ..., OA), (at, ..., a”) son las coordenadas del 


24—1843 
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origen nuevo y (E,, ..., €”) y (EY, E") son, respectivamente, 
las coordenadas antiguas y nuevas de un punto arbitrario X. 
Por razones puramente formales la fila (1, El, , E”) ha sido 
llamada en el p. 30.1 fila coordenada ampliada del “punto X siendo 
(El, ..., E”) la fila corriente de sus coordenadas. De la fórmula 
(8) se desprende directamente que 
: (1, 5% ...» E) =(1, 1 ...) E)-Trr, (9) 
donde 
la a” 
O 
a | (10) 
0 1 Ta 


La matriz Tra se ltama matriz del cambio de la base de refe- 
rencia R por ta base de referencia R'. De (10) resulta que el deter- 
minante de la matriz Tr.pR coincide con el determinante de la 
matriz || [|] que es la matriz del cambio de la base coordenada 
antigua del espacio vectorial L(A) por la base mueva. Recíproca- 
mente, cualquiera que sea la matriz T, de tipo (10) con el deter- 
minante diferente de cero y cualquiera que sea la base de referen- 
cia R dada de antemano, las fórmulas 5) y los números e, ..., a” 
permiten determinar unívocamente una base de referencia R “tal 
que la matriz T, sea la matriz del cambio de R por R”. 

De la fórmula (9) se desprende el siguiente Cotolario impor- 
tante. 

corouarjo. Sean R, R' y R” tres bases arbitrarias de referencia, 
sea Tr la matriz del cambio de R por Ry sea Tr-r la matriz 
del cambio de R' por R”. Entonces la matriz del cambio de R por R' 
será igual al producto Tr-r'T RR. En particular, si Tr»g es la 
matriz del cambio de la base de roferencia R por la base de referen- 
cia R', la matriz del cambio de R' por R es la malriz inversa 
TRR. 

En efecto, indicando por (Él, ..., E%), (E, ..., EN) y 
(A y En“) las coordenadas de un punto arbitrario X en las 
bases de referencia R, R' y R, respectivamente, tenemos, 


A A A 0 


y, al mismo tiempo, se tiene 


(01,8, ..., 89 =(1, El, ..., 585%)-Trr= 
=(1, 8% ..., E%)-TrrTRR- 
Por consiguiente, para cualesquiera E!'”, ..., 57 EK resulta 


(1MES EP) Trre=(1, ES, .... EU) TrerTRR. 
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Tomando aquí para E'”, ..., E” las coordenadas en la base de 
referencia R” del vértice de esta base de referencia, obtenemos 
Teror =TRRTRR. (11) 


Si la base de referencia R” coincide con la base de referencia 
R”, la matriz Tr-r es, obviamente, Ja matriz unidad y la relación 
(11) se convierte en 

E=TRrRTRR) 
de donde resulta 


TreR=TRR- (12) 


Hasta el momento nos hemos interesado sólo por la ley de va- 
riación de las coordenadas de los puntos. Preguntémonos ¿cómo 
varían las ecuaciones de los conjuntos de puntos cuando se pasa 
de una base de referencia coordenada a otra? 

Sea dada una ecuación 


(E, ..., E =0 (13) 


de un conjunto Vi en una base de referencia R. Esto significa, 
por definición, que un punto arbitrario X pertenece a Vi cuando, 
y sólo cuando, sus coordenadas E!, ..., E” satisfaten la relación (13). 
Al pasar a una base de referencia coordenada nueva R“, tenemos 
según (8) 


E=2 EF (=1, ..., n). 


Introduciendo en (13) estas expresiones para E!, ..., E”, obte- 
nemos | 

[E ma+ra, ..., DET a”) =0. (14) 

Puesto que las coordenadas nuevas EY, ..., EY de un punto 


arbitrario X satisfacen la relación (14) cuando, y sólo cuando, 
XEM, resulta que (14) es la ecuación que buscamos del conjunto 
MD? en la base de referencia coordenada nueva. El primer miembro 
de la igualdad (14) es una función g(8”, En) de las varia- 
bles E', ..., 87" que se distingue, en general, por su forma de la 
función inicial f. Sin embargo, si f es un polinomio de un grado 
s en las variables $, ”, se ve de (14) que g también será 
un polinomio de grado s en las variables A e 

Igual que en el caso de los espacios vectoriales (véase el 
p. 5.1), el problema sobre la transformación de las coordenadas 
afines está ligado estrechamente al problema de la determinación 
de todos los automorfismos de un espacio afín Y sobre un cuerpo 
conmutativo fijo K, Sea n la dimensión del espacio Y y sea 4 un 
automorfismo de A sobre K (véase el p. 29.1). Tomemos en YA una 


24? 
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base de referencia coordenada R=(0, OA,, ..., 0A,). Sus vérti- 
ces O, A, --.. A, forman en A un sistema linealmente indepen- 
diente de puntos. “Com la relación de independencia lineal se 
conserva en los automorfismos, los puntos OA, A,A, .... A,vl 
pueden ser considerados como los vértices de una base de referen- 


cía coordenada nueva RA=(04, DAA, A, , OAA. A). Indique- 
mos por (X)R, + .., (X)% las coordenadas des un punto arbitrario X 
calculadas en la base de referencia R y Sea 


[X]r=(1, (X)R, --., (X)R) 
la fila ampliada de coordenadas del bo X en la base de refe- 
rencia R. La fórmula (2) toma entonces la forma siguiente: 
OX =(X)R-OA, +... +(X)R-04,. (15) 
Como los isomorfismos conservan las relaciones de dependencia 
lineal entre vectores, obtenemos de (15) 
DAXA =(XIR-OAÑ A+... H(X)R:OALA, A. (16) 


En otras palabras, las coordenadas de X.4 en la base de refe- 
rencia RA coinciden con las coordenadas de X en la base de re- 
ferencia R, es decir, en notación abreviada 


(X41rg 4 =[X]R- 
Aplicando la fórmula (9), obtenemos 
(X]r=1[X4]r y =[X4)-T rar 
y por esto, debido a (12), resulta 
(X4Je=[X1T rr: (17) 


La matriz Trg yg se llama matriz del automorfismo A en la base 


de referencia R y se indica por [.4]¿ o simplemente por [4], si la 
base de referencia R se conoce de antemano. Por esta razón la re- 
lación (17) puede ser representada en la forma definitiva 


[X4] =[X] [4]. (18) 
Sean A y 3 dos automorfismos arbitrarios dados del espacio Y. 
Aplicando la fórmula (18), obtenemos 
[X (48)) = (X] [43], 
(X 4) 8) =[X4][8) = [X] (4] [8], 
de donde resulta 
(X] [43] =[X](4] [8)). 
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Puesto que esta igualdad debe cumplirse para cualquier punto X, 
tenemos 


[438] =[4] [8] 
y, por consiguiente, 


[47*] = [4]. 
Consideremos un ejemplo. Sea 4 una traslación de A de vector 
00' de coordenadas at, ..., a” en la base de referencia R= 


= (0, OA,, ..., OA,). De las fórmulas (9) y (5) obtenemos entonces 
Fl —al —e ... —a” 

O 1 0 ... 0 

[AJ=TrrR4=| 0 0 1... 0 


0.00. 0... 17] 
En cambio, si el automorfismo 4 deja inmóvil el origen de la 


base de referencia coordenada R, la matriz [.4] se descompone en 
l y en la matriz [| 7/[] del cambio en el espacio vectorial L (9). 


Ejemplos y problemas 


Il. Hállense las condiciones necesarias z suficientes de intersección de dos 
rectas dadas por ecuaciones en coeficientes directores. ó 
2. Hállense las ecuaciones paramétricas del plano dado por el sistema de 


ecuaciones 
xy4+ x3—2x3+3x,¿=1, 
Xy + 2x3 xy + 2x, =3, 
q — Xy — 4x9 — 5x, = —-3. 
3. Demuéstrese que todo plano Di de un espacio afin es el mismo un espacio 
afín cuya dimensión es igual a la dimensión de M. 
4. Demuéstrese que un plano Di de un espacio afín diferente de un punto 


es paralelo a cualquier plano que no corte el primero cuando, y sólo cuando, 
£M es un hiperptano. 
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Hasta el momento no hemos considerado conceptos geométricos 
tan esenciales como son los conceptos de la relación “hallarse entre”, 
de semiplano y de convexidad. La razón de esto estriba en que en 
los espacios afines sobre un cuerpo conmutativo arbitrario estos con- 
ceptos no pueden ser introducidos de un modo natural. Para tra- 
tarlos es necesario limitar la clase de cuerpos conmutativos y pasar 
al estudio de los espacios afines sobre cuerpos conmutativos orde- 
nados, por ejemplo, sobre el cuerpo de los números reales. Las 
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propiedades principales de estos espacios constituyen precisamente 
el tema que se estudia en este parágrafo. 


31.1. Rayos. Recordemos que un cuerpo conmutativo K se llama 
ordenado, si para los elementos de K, además de las operaciones 
de adición y de multiplicación, se introduce lambién una relación 
de orden < sometida a dos condiciones: 


asPorary<B+w, (1) 
0O<a y 0<Pb>0<ab (2) 
(a, B, yE K). 


El ejemplo más importante de un cuerpo conmutativo ordenado 
es el cuerpo de los números reales que es el que debe tenerse en 
primer orden en cuenta en todos los razonamientos ulteriores de 
este parágrafo y del siguiente. , 

No está de más observar que de (1) y (2) se desprenden direc- 
tamente las siguientes propiedades: 

Para cualquier elemento a de un cuerpo conmutativo ordenado se 
tiene 

0O<at y —a<o0 (3) 
y, en particular, O<1 y — 1<0. 

Para unos elementos arbitrarios a, $ y y de un cuerpo conmu- 

tativo ordenado se tiene 
<a y PB<y>oab<ay. (5) 


Se toma por definición que la relación a < $ equivale a la con- 
cha ab y af y que las relaciones a >fP y a > B significan 
o mismo que las relaciones PB < a y P < «u. El elemento no negativo 
de los elementos a y —« se llama valor absoluto de a y se indica 
por Ja]. De las relaciones de (1) a (5) se deduce fácilmente que 


[|—a|=j0], ja+Bl<lal+1B! y Jabl=la|-1Bl. 
Consideremos ahora un espacio afín Y sobre un cuerpo conmu- 


tativo ordenado K. Se dice que en el espacio afín A el punto X 
se halla entre los puntos Á y B, si 


AX=4AB y 0<iS1 (4€K). (6) 


Está claro que si X se halla entre A y B, los puntos A, X y B 
se hallan sobre una misma recta. Además, la relación «hallarse entre» 
es simétrica: si X se halla entre A y B, X se halla entre B y A. 
Efectivamente, de (6) obtenemos 


AB=AX+4+XB=14-AB+XB, 
y por esto o 
BX=(1I—3-BA, 0<1—A<l1. 
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Sean A, B y C unos puntos, diferentes dos a dos, que se hallan 
sobre una misma recta. Para un valor adecuado A4€ K tenemos en- 
tonces AC=4-AB. El número A satisface a una de las condiciones, 
y sólo a una de ellas: a) A<0; b) 0<A<I1 y c) ¿> !. Es fácil 
comprobar que en el caso a) el punto A se halla entre B y C, que 
en el caso c) el punto B se halla entre A y C y que en el caso b) el 
punto C se halla, por definición, entre A y B. 

Por consiguiente, de cualesquiera tres puntos que se encuentran 
sobre una misma recta uno, y sólo uno, se halla entre los otros dos. 

Análogamente se comprueba también la segunda propiedad prin- 
cipal de la relación «hallarse entre». si el punto X se halla entre 
los puntos A y B y el punto Y se halla entre A y X, el punto Y 
se halla entre A y B. 

Empleando el concepto «entre», podemos introducir en toda recta 
dos relaciones naturales de orden llamadas también direcciones de 
la recta. Tomemos sobre la recta dada M dos puntos distintos cua- 
lesquiera A y B e introduzcamos para los puntos de V? una relación 
binaria < ¿p que depende de A y de B tomando, por definición, 
que X< a¿nY es verídica si 


AX =14-AB, AY =u-AB y A<pu (A, LEX), (7) 
es decir, ordenando los puntos de la recta Wi según el orden en el que 


se encuentran sus coordenadas en la base de referencia (A, AB). 
Está claro que los órdenes < ¿a Y < aa son duales es decir, que 


X<apY ESDVY<prA- 


Por otra parte, el orden < pg definido sobre M mediante otro 
par cualquiera de puntos P, Q coincide con el orden < ¿a, Si PS 20, 
y coincide con cl orden < pa. Si Q < 49gP. Por consiguiente, entre 
los órdenes de tipo <pg Sobre una recta Mi existen solamente dos 
órdenes diferentes. Estos órdenes se llaman órdenes o direcciones natu- 
rales de la recta. Los automorfismos del espacio Y sobre K con- 
servan la relación «hallarse entre» y también conservan los órdenes 
naturales. Sin embargo, gracias a la existencia sobre una recta de 
dos ordenes naturales, los automorfismos del espacio. A pueden trans- 
lormar un orden natural sobre la recta Mi en el otro orden natural 
sobre la misma recta. Por esto, es invariante el par de relaciones 
duales de Órdenes y no la relación de orden. 

TEOREMA, Si una funcional lineal [(X) no es constante sobre una 
recta Di, la apticación [(X) — X(X € M) es una aplicación biyectiva 
de K sobre Wi en la que el orden <, definido sobre el cuerpo con- 
mutativo K, se transforma en uno de tos dos órdenes naturales de- 
fínidos sobre M. 

Fijemos sobre la recta unos puntos O y A tales que f (0) + f (A) 
y sea 
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La aplicación 4 — X, es, debido a (7), una aplicación biyectiva de K 
sobre Vi que transforma el orden dado sobre K en un orden natura) 
sobre Di. De la linealidad de f se deduce que 


E) =MEA)—FHO) 4H (0) =04+B. 


Puesto que 20, la aplicación f(X) —A es una aplicación 
biyectiva de K sobre K que o bien conserva el orden o bien lo 
invierte. La aplicación f(X) — X, por ser la composición de las 
ei FIX) —4 y A— X, también es biyectiva y transforma 
el orden sobre K en un orden natural sobre Df. 

Cualesquiera que sean dos puntos A y B de un espacio Y se 
llama segmento [A, B) el conjunto de todos los puntos que se hallan 
entre Á y B. Los puntos A y B se llaman extremos del segmento [A, B)]. 
De la definición de la relación «hallarse entre» se deduce que los 
extremos del segmento pertenecen al segmento y de la simetría de 
esta relación se deduce que [A, B] =[B, A]. Está claro que el seg- 
mento [A, A] está formado sólo por el punto A 

Se dice que un número A se halla entre los números a y B 
(a, PB, AEK), sia <i<PoP<4i<oa. El conjunto de los números 
que se hallan entre a y f se llama segmento numérico y se indica 
por [a, P)]. Del teorema anterior obtenemos el siguiente corolario: 

COROLARIO. El conjunto de los valores que toma una [funcional 
lineal [(X) sobre un segmento [A, B] es un segmento numérico 
[F(A), F(B))]. El conjunto de los valores que toma | sobre la recta M o 
bien coincide con todo el cuerpo conmutativo K (si [| noes constante sobre 
Mi) obien está formado por un solo número (si f es constante sobre MI). 

Introduzcamos ahora el concepto de semirrecta o de rayo. Se dice 
que el punto X se encuentra al mismo lado del punto O que el 
punto A, si X se halla entre O y A o si Á se halla entre O y X. 

Un conjunto de puntos Mi, del po A se llama rayo, si en M, 
existen unos puntos distintos O y A tales que Mi, está formado por 
todos los puntos X que se encuentran al mismo lado del punto O 
que el punto A. El punto O se llama vértice del rayo que será 
indicado ahora por Vi, 4. 

De esta definición se deduce que todos los puntos del rayo Vio, 
pertenecen a la recta OVA. Si tomamos como base de referencia 
coordenada sobre la recta OV A ta base de referencia (O, 04), a todo 
AE K le corresponderá un punto X de coordenada lineal A tal que 
OX=A0A. Está claro que el rayo Wo, consta de todos los puntos 
de la recta OVA que tienen coordenada no negativa. En particular, 
de aquí se ve que todo rayo tiene solamente un vértice O y que 
si sobre el rayo Mi, , se toma un punto cualquiera B diferente de O, 
los rayos Mo, y Mos coinciden. Es fácil comprobar también que al 
tomar en una recta un punto arbitrario O, la recta se descompone 
exactamente en dos rayos diferentes de vértice O. 
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Supongamos que una funcional lineal f(X) no es constante sobre 
una recta M. En virtud del teorema 1, sobre la recta Mi existe 
un punto O, sólo uno, en el que la funcional f se anula. Puesto que 
la aplicación f(X) — X transforma el orden de K en un orden natural 
de Y, los conjuntos M, y Wi, de puntos de M conA<0 y 1>0, 
respectivamente, son precisamente aquellos rayos en los que el punto O 
divide a la recta Yi. 


31,2. Semiespacios. El] análogo del concepto de rayo en el caso 
de planos multidimensionales de un espacio A es el concepto de 
semiplano y, en particular, el concepto de semiespacio que pasamos 
ahora a definir. 

Sea de nuevo A un espacio afín sobre un cuerpo conmutativo 
ordenado K y sea B un hiperplano arbitrario de A. Si PB contie- 
ne unos puntos X e Y, contiene también .todos los puntos 
de la recta X yY. Por esto, cualquier segmento [4, B)] de 9 o bien 
está contenido integramente en $ o bien contiene no más de un 
punto de $. Se dice que los puntos A y B se hallan a distintos lados 
del hiperplano PP, si ambos no pertenecen a Y, pero el segmento 
[4, B] contiene un punto de $. En todos los demás casos se dice 
que los puntos A y B se hallan a un mismo lado de *B lo que se 
expresa simbólicamente así: Am B($). En particular, A == A(%) 
y de A=B($) se deduce que B== A(%B) para cualesquiera A y B. 
Además, si AE YB, se tiene A==B($B) para cualquier punto B. 

TEOREMA 1. Sea f(X) una funcional lineal no constante sobre el 
espacio A y sea Y un hiperplano formado por los puntos X tales 
que [(X) =0. Entonces se tiene para cualesquiera A y B 


Au B(B) => F(4)-$(B) > 0. (1) 

Supongamos que A y B se hallan a distintos lados de $. El con- 
junto de los valores que toma f (X') en los puntos del segmento (A, B] 
es el segmento númerico y (A), f(B)]. Tenemos, por hipótesis, 
[ (4)0, f(B) 0 y 0€ [f (4), /(8)]. Por consiguiente f (4)-f(B) <0. 
Reciprocamente, supongamos que para unos puntos A y B se tiene 
F(A)-F(B) <0. Entonces 0€ [f (4), f(B)], es decir, para un punto 
XE[A, B] se tiene f(X) =0, de donde X € % y por ello los puntos 
A y B se hallan a distintos lados de %. 

COROLARIO. Si el punto A no pertenece al hiperplano B yA = B (Y) 
y A=C(QP), se tiene B==C (P). 

Efectivamente, si los puntos A, B y C satisfacen las exigencias 
indicadas, tenemos según el teorema 1 


F(A)0, FAJHB)>0 y HA)HC)>0, 


de donde (Ff(A)*f(B)Ff(C)=>0 y, por consiguiente, f(B)f(C)>0. 

Introduzcamos ahora el concepto principal: cualesquiera que 
sean un hiperplano $ y un punto arbitrario AG Y, el conjunto de 
los puntos que se hallan a un mismo lado de P que el punto A 


378 Cap. VIH. Espacios afines 


se llama semiespacio definido por el hiperplano Y y por el punto A. 
Convengamos en indicar provisionalmente este semiespacio por Ay 4. 

Se ve de la definición que Ay contiene indudablemente el punto 
Á y el hiperplano Y. El conjunto que se obtiene de Ay 4 omitiendo 
el hiperplano P se llama semiespacio abierto definido por el hiper- 
plano Y y por el punto A. ' 

TEOREMA 2 Si los puntos A y B no pertenecen al hiperplano Y 
y el segmento [A, B)] no contiene puntos de $, los semiespacios Ha 
y Aya coinciden. Sí los puntos A y C se hallan a distintos lados 
de Y, se tiene Uya + yc y cualquier semiespacio Uyp coincide con 
Aya o con Myc . 

Consideremos una funcional lineal no constante f(X) que se 
anula sobre YB. Puesto que el segmento (A, B] no contiene puntos 
de Y, los números F(A) y f(B) son de un mismo signo debido a 
la fórmula (1). Análogamente se comprueba que los números f (4) 
y f(C) tienen signos diferentes. Del teorema 1 resulta que para 
cualquier punto DE siendo F(D)> 0 el conjunto Agp coincide 
con la colección U* de los puntos X tales que 


HA) >0 (2) 


y siendo f(D)<0 el conjunto Ayp coincide con la colección A” 
de los puntos X tales que 


H(X)< 0. (3) 
Por consiguiente, un semiespacio arbitrario Ayp coincide con 
A* o con A-. Si f(4) > 0, de las relaciones mencionadas obtenemos 
Aga =Ays = A+? y Asc =9A7; 
en cambio, si f(A)<0O0, se tiene 
Hea=Ayp = MU" y uc = A+. 


COROLARIO 1. Para toda funcional lineal no constante [(X) el 
conjunto de los puntos X que satisfacen la desigualdad 


HX)>0 
y el conjunto de los puntos X que satisfacen la desigualdad 
f(x) <0 
representan los dos semiespacios definidos por el hiperplano 
f(X)=0. (4) 
Los conjuntos de los puntos X definidos por la desigualdad es- 
tricta 
f(X)>0 (5) 


y, respectivamente, por la desigualdad estricta 
HA)<O (6) 
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representan los semiespacios abiertos en los que el hiperplano (4) 
divide al espacio afin dado Y. 

Efectivamente, la ecuación (4) determina, según el p. 29.4, un 
hiperplano $ que define los semiespacios (2) y (3). Los conjuntos 
de los puntos definidos por las desigualdades estrictas (5) y (6) se 
obtienen de los semiespacios (2) y (3) omitiendo las soluciones de 
la ecuación (4) y son, por consiguiente, semiespacios abiertos. 

COROLARIO 2. Supongamos que en un espacio Y de dimensión finita 
n se ha escogido una base de referencia coordenada cualquiera. El 
conjunto de los puntos X cuyas coordenadas E',..., E” satisfacen 
una desigualdad determinada 


abit... +05" >, 


en la que al menos uno de los coeficientes principales «,, ..., «,, €s 
diferente de cero, representa entonces un semiespacio definido por el 
hiperplano 

ati+... +0,” =0%p. (7) 


El conjunto de los puntos X cuyas coordenadas satisfacen ta de- 
sigualdad estricta 


A+... 05” >% 


representa un semiespacio abierto definido por el hiperplano (7). 
La funcional definida mediante la fórmula 
FX) =0a0, E +... +0,58”—as 
es, por lo visto en el p. 30.1, lineal y no constante sobre A. Apli- 
cando a f el corolario 1, obtenemos las afirmaciones requeridas. 

Hemos considerado hasta el momento los casos, en cierto sentido, 
extremos: rayos o semirrectas y semiespacios. No obstante, es fácil 
definir también el concepto de semiplano para un plano cualquiera 
Mi contenido en el espacio A. En efecto, sabemos que DM puede 
ser considerado como un subespacio sobre el mismo cuerpo conmu- 
tativo K sobre el cual está definido el espacio A. Aplicando lo 
expuesto anteriormente al espacio afin * sobre K, obtenemos el 
concepto de El dr del espacio Mi. Estos semiespacios se lla- 
man semiplanos del plano Dt. 

TEOREMA 3. Supongamos que el plano M y el hiperplano Y no 
son paralelos y sea A un punto de Íh que no pertenece a B. La in- 
tersección del semiespacio Uy a y del plano Di será entonces un semi.- 
plano en M definido por el punto A y el hiperplano MN Y del 
espacio M 

Todo semiplano de M es la intersección de Wi con un semiespacio 
adecuado Uy A del espacio A. 

Sea A una funcional lineal no constante que se anula sobre 
P y sea Ff(4A) > 0. El semiespacio Aga es entonces el conjunto de 
las soluciones de la desigualdad f(X)=>0 y la intersección NN 


————— o 
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es el conjunto de los puntos Y €M que satisfacen la desigualdad 
f(Y)>0. Puesto que la contracción de f sobre Vi es una funcional 
lineal sobre Mi, resulta, según el corolario 1, que ej conjunto 
MnPya es un semiplano en WM. Análogamente se demuestra la 
segunda afirmación del teorema 3. 

Volviendo de nuevo a los semiespacios del espacio A plantéemonos 
el problema: ¿de qué modo pueden situarse con respecto uno al otro 
dos semiespacios Aga y yn? 

Consideremos por separado cada uno de los tres casos que pue- 
den darse aquí: 

1) Los hiperplanos $ y 2 coinciden. Entonces los semiespacios 
Aga y Aos o bien coinciden o bien la unión de ellos es todo el 
espacio A y la intersección es el hiperplano %. 

2) Los hiperplanos PB y Ú no se cortan y, por consiguiente, son 
paralelos. Aquí pueden darse los siguientes subcasos: 

a) PéMoas y DÉ Apa; entonces ga N Mas =D . 

b) PENAS y LCé Ana; entonces Ags > Aya. 

c) PéAos y DENLA; entonces Aga > Ang. 

d) PEAos y LE Aya; entonces Aga N na y Z. 

Los conjuntos del último tipo se llaman a veces hipercapas. La 
intersección de cualquier recta con una hipercapa es, como puede 
verse fácilmente, vacía o coincide con toda la recta o es un seg- 
mento de la recta. 

3) Los hiperplanos PH y X se cortan. El conjunto PNL es, se- 
gún el p. 29.2, un plano de codimensión 2. En este caso la inter- 
sección de los semiespacios Ay1NAna se llama hiperángulo de 
arista PND. 


31.3. Conjuntos convexos. Un conjunto €. de puntos de un es-. 
pacio afín A sobre un cuerpo conmutativo ordenado K se llama 
convexo, si 

XEG e YFEGDÍ[AX, Y]ES. (1) 


De aquí se deduce que los planos del espacio Yl, así como los 
segmentos, rayos, semiplanos y semiplanos abiertos de Y son conjun- 
tos convexos. 

De la definición (1) se ve directamente que la intersección de 
cualquier familia de conjuntos convexos es un conjunto convexo. En 
particular, la intersección de cualquier familia de semiespacios es 
un conjunto convexo. 

La intersección de todos los conjuntos convexos que contjenen 
un conjunto fijo de puntos Di se llama adherencia convexa del 
conjunto MD y se indica por ConvM. De la observación hecha 
anteriormente se desprende que la adherencia convexa de un conjunto 
cualquiera M es el menor conjunto convexo que contiene a M. 
Está claro que Wi es convexo cuando, y sólo cuando, ConvWl zx MI, 


$ 31. Cuerpos convexos 381 


También es evidente que de M <M resulta Conv M <= ConvR. Todo 
punto XEA constituye por sí mismo un conjunto convexo y, por 
consiguiente, Conv X =X. Sin embargo, ya para dos puntos X e Y 
tenemos, como puede verse fácilmente, la fórmula 


Conv(X, Y) =[(X, Y]. (2) 


El teorema que sigue ofrece la expresión para la adherencia 
convexa de un conjunto cualquiera. 

TEOREMA I. Escojamos en el espacio A un punto O. La adherencia 
convexa Conv Mi de un e arbitrario de puntos Wi es el conjunto 
de todos los puntos X€Yl tales que para cada uno de ellos existe 


en M un sistema finito de puntos M,, ..., M, ligados a X por la 
relación 
OX =1,:0M,+...+4,:0M,, (3) 


donde %,, ..., A, son unos números adecuados de K sometidos a las 
condiciones 


A>0 ...,2,>0, (4) 
A+...+1,>1. (5) 


Indiquemos por Mi, el conjunto de los puntos X que cumplen 
las exigencias (3), (4) y (5) y demostremos que Mi, es convexo. 
Sean A, B€ Vi,, de modo que para convenientes M, EM y ap P,EK 
se tenga 


OA =a,:0M,+...+0,:0M, 
0B =$,0M,+...+P,:0M,, 
a, =0, B,>0 i=1, ...) s), 
A+... +0=P+...+8B,=1. 
Para un punto cualquiera X€ (A, B] tenemos 
0X =1-OA+u:0B  (1>0, 4>0 y A+p=1) 
y, por consiguiente, 
OX =(1a, +18 ,)-0M,+... +(Mda,+uB,)-0M,. 
Puesto que aqui 


donde 


lu +HB,=>0 =1, a s) 


Ma + HB) =1¿ a+ ul, 


resulta que XEM. y el conjunto Mi, es convexo. 

Resta demostrar que todo conjunto convexo N que contiene al 
conjunto Yi contiene también todos los paolo” X que satisfacen 
las condiciones (3), (4) y (5). En estas condiciones figura el número 


y además 
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natural s y para s=1 la afirmacion que acabamos de enunciar es 
trivial. Apliquemos ahora la inducción según s. Supongamos que 
para un valor de s cualquier punto X que satisface las condiciones 
(3), (4) y (5) pertenece a N. Consideremos el punto Y que satisfaga 
las condiciones 


OY =0,:0M,+...40:0M,+0s410M,,, (M,€M), 
A+... +064+0, =1l,0,>0 '(i=l, ..., s+1). 


Siendo aquí a,=0 o «,,, =0, tenemos, por la hipótesis de induc- 
ción, Y EN. Supongamos por esto que ,-%,+, > 0, de modo que 
tomando p=a, +... +0, tendremos 4 >0. El punto X definido 
por la relación 


a ii Un 
0OX=%0M,+...+%0M, 


salisface las condiciones (3), (4) y (5) con s fijo y, por consiguien- 
te, XEN. Tenemos ahora 


OY =p-0X +0,,1:0M, 4, (140%, =1, p>0 y %4,>0), 


de modo que YE[X, Ms,,). Como R es convexo y X, M,,,EM, 
tenemos Y EN que es lo que se quería demostrar. 

En cada una de las condiciones (3) figura solamente un número 
finito de puntos del conjunto. Por ello, del teorema 1 resulta que 
la adherencia convexa de un conjunto infinito de puntos es la unión 
de las adherencias convexas de todos los subconjuntos finitos del con- 
junto dado. 

Se dice que la dimensión de un conjunto convexo E es igual a r, 
si € está contenido en un plano r-dimensional y no está contenido 
en ningún ¿pene de menor dimensión. Análogamente se define tam- 
bién la codimensión de un conjunto convexo, 

COROLARIO. Si el número máximo de puntos linealmente indepen- 
dientes del conjunto M es igual a r+-1, la dimensión de Conv Mi 
es igual a r. 

Supongamos, por ejemplo, que todos los puntos del conjunto M 
dependen linealmente de los puntos linealmente independientes 
Ao Aj ..., A, de este conjunto. Entonces Di está contenido 
en el plano N=A,V A, V...V A, de dimensión r y por ello 
Conv Wi = Conv. Pero un plano es un conjunto convexo y, por 
consiguiente, Conv M S 9. 

Un conjunto convexo S se llama propio en el espacio A, si la 
codimensión de S es igual a cero. Los demás conjuntos convexos 
se llaman impropios en A. Como ejemplos de conjuntos convexos 
propios podemos indicar el mismo espacio Y, así omo los semies- 
pacios y los semiespacios abiertos de éste. Los pla:1wos de codimen- 
sión no nula y sus semiplanos son conjuntos convexo: impropios en 2. 
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Está claro que todo conjunto convexo € es un conjunto convexo 
propio en el plano que sirve de adherencia lineal de G. 

Se dice que un punto S se halla estrictamente dentro del seg- 
mento [A, B). si S es diferente de A y de B y SE[A, B]. Un 
punto S se llama interior de un conjunto convexo €, si en toda 
recta que pasa por S existe un segmento que contiene a S estric- 
tamente dentro de sí y pertenece íntegramente a S. 

Se dice que un punto $ es tangente a un conjunto convexo 3, 
si existe una recta que pasa pal S tal que cualquier segmento de 
ella que contenga al punto S estrictamente dentro de sí contenga 
al menos un punto de $. En particular, todos los puntos del con- 
junto S son tangentes a €. Pero pueden también existir puntos 
tangentes a S que no pertenezcan a S. Si todos los puntos tangentes 
a € pertenecen a S, se dice que 5 es un conjunto cerrado. Un 
conjunto convexo S se llama abierto, si todo punto S suyo es un 
punto interior de 6. 


TEOREMA 2. La intersección de una familia arbitraria de conjuntos 
convexos cerrados es un conjunto convexo cerrado. La intersección de 
una familia finita cualquiera de conjuntos conuexos abiertos es un 
conjunto convexo abierto. 

La primera afirmación se deduce directamente de la definición 
de los conjuntos cerrados. Demostremos la segunda ajirmación. Sean 
YN? y N unos conjuntos convexos abiertos. El conjunto Nin N es 
entonces convexo. Si es vacio, no hay nada que demostrar, ya que 
los conjuntos vacíos son, por definición, abiertos. Sea SEMNN y 
sea BD una recta cualquiera del espacio A que pasa por el punto S. 
Sobre esta recta existen, por hipótesis, unos segmentos que contie- 
nen a S estrictamente dentro de si y que pertenecen a los respectivos 
conjuntos M y NR. Pero la intersección de estos segmentos será en- 
tonces el segmento deseado que pertenece a WN N y que contiene 
al punto S estrictamente dentro de sí. 

Introduzcamos otro concepto importante. Un punto S se llama 
punto frontera de un conjunto convexo OU, si S es tangente a Y, 
pero no es interior de €. En otras palabras, se dice que S es un 
punto frontera de €, si existe una recta que pasa por S tal que 
todo segmento de la misma que contenga al punto S estrictamente 
dentro de sí contenga al menos un punto de € y un punto que no 
sea de S. El conjunto de todos los puntos frontera de un conjunto 
convexo S se llama frontera del conjunto S. 


TEOREMA 3. Un semiespacio arbitrario Aga, definido en el espacio 
Y por un Rhiperplano $ y por un punto Á que no se halla sobre Y, 
así como el semiespacio abierto correspondiente Ula = UAB, son 
unos conjuntos convexos cerrado y abierto, respectivamente, en A. La 
Frontera de ambos conjuntos es el hiperplano B. Todo conjunto con- 
vexo E impropio en A no contiene puntos interiores. 
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Sea PE PVP. Consideremos la recta AVP y en ella un segmento 
arbitrario [B, C] que contiene al punto P estrictamente dentro de 
sí. Puesto que la recta AVP no se halla sobre Y, los extremos 
del segmento [B, C] tampoco pertenecen a $ y, como PE[B, C], 
los puntos B y C se hallan a distintos lados del hiperplano %B. Por 
consiguiente, uno de los extremos B o C pertenece al semiespacio 
abierto Aga y el otro extremo no pertenece a Hg. Luego, el punto 
P es un punto frontera tanto de Aya como de Aga. 

Demostremos que cualquier punto D¿Aya no es tangente a Aya 


y, por consiguiente, tampoco es tangente a Aga. Sea M una recta 
cualquiera que pasa por el punto D. Si esta recta no se corta con $, 
pertenece integramente al semiespacio Ao =Ayo /B y, por ello, 
todo segmento de la misma no contiene puntos de Aga. Si M se 
corta con Y en un punto P, existen en Mi unos e B y C di- 
ferentes de D y P tales que DE[B, P] y CE[D, P]. Por consi- 
guiente, el segmento [B, C] se halla sobre W?, contiene a D estric- 
tamente dentro de sí y no contiene puntos del semiespacio Xy 4. Por 
esto, el punto D no es tangente a YAya4. Al mismo tiempo hemos 
dernostrado que todos los puntos del semiespacio abierto AgA son 
interiores y, por consiguiente, cualquier semiespacio abierto es un 
conjunto convexo abierto. 

ara demostrar la última afirmación del teorema es suficiente 
indicar por Y el hiperplano que contiene, por hipótesis, al conjunto 
y observar que todo segmento de la recta AVP (PES y A¿B) 
que contiene estrictamente dentro de sí al punto P contiene también 
necesariamente puntos que no pertenecen al hiperplano Y. 

De los teoremas 2 y 3 obtenemos un corolario importante. 

COROLARIO 1. La intersección de cualquier familia de sermiespacios 
de un espacio Y es un conjunto convexo cerrado de YU. La intersec- 
ción de cualquier familia finita de semiespacios abiertos del espacio 
%A es un conjunto convexo abierto de 

Recordando que cualquiera que sea la funcional linea! no cons- 
tante Ff(X) el conjunto de soluciones de la desigualdad f(X)>0 
es un semiespacio y el conjunto de soluciones de la desigualdad 
estricta f(X) > 0 es un semiespacio abierto, obtenemos btro corolario. 

COROLARIO 2 Sean [,(X), ..., f,(X) unas funcionales lineales no 
constantes sobre un espacio afín Y. Entonces el conjunto de las so- 
luciones X del sistema de desigualdades 


(>0 (=1, ..., $) 


es un conjunto convexo cerrado de Y y el conjunto de las soluciones 
del sistema de desigualdades estrictas 


[(X)>0 (í=1, ..., 5) 
es un conjunto convexo abierto de A. 
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Un hiperplano BY se llama hiperplano soporte de un conjunto 
convexo S, si PNG X<S y todos los puntos de GS se hallan a un 
mismo lado de $. Las intersecciones de los hiperplanos soportes 
con el conjunto 6 se llaman facetas de €. De estas definiciones 
se desprende directamente que las facetas de los conjuntos convexos 
pertenecen a las fronteras de estos conjuntos y son ellas mismas 
conjuntos convexos. Las facetas de los conjuntos convexos cerrados 
son conjuntos cerrados. 


Complementos y ejemplos 


Sea A un espacio afín arbitrario de dimensión finita n >> 3 sobre un cuerpo 
conmutativo ordenado K 

1. La adherencia convexa de unos puntos Ay, .... Ar41 linealmente Inde- 
pendientes se lama simplice r-dimensional de U. Si 7 < n, este símplice se halla 
en el plano r-dimensional A,V...VA?+, y por lo tanto es un conjunto con- 
vexo improplo en YU. Los símplices n-dimenstonales se llaman simplemente sím- 
plices se Y. 7 puntos Aj, .... An+1 Se llaman vértices del símplice 
Conv Latas +r?- 

A Describanse los simplices de los espacios unidimensionales, bldimenslo- 
nales y tridimensionales. 

3. Para todo r, OGG r«in—l, todas las facetas r-dimenstonales de un sím- 
plice A=Conv (Ay. .-., An+1) Son unos símplices Conv(A¡ , -... Á 
(1<!1<...< fp <n+!). 

4. Tado conjunto convexo $ compuesto sólo de puntos frontera de un sím- 
plice A pertenece erario a un símplice (n—1])dimensional A!= 
= Conv (Aa, iaa ÁA¡- $ +.“ An+11- 

5. Sf los puntos As, ..«» Ap+1 Son MMnealmente independientes y para unos 
puntos B,, ..., Br+1 se tiene 


Conv lAs, ...» A+ +1) = Conv ÍB,, ...» B++1). 


los conjuntos (Az, .-.. Ar+1) y (Br, --.. Br+1) coinciden. 

6. La adherencia convexa C==Conv (Cy, .... C¿) de un sistema finito arbl- 
trario de puntos C,, ..., Cs de Y se llama poliedro convexo de Y. 

Un sistema de puntos se llama convexamente irreducible, sí ningún punto 
del sistema no está contenido en la adherencia convexa de los demás puntos. 

Demuéstrese que siendo C= Conv [Cr A Cs) un polledro convexo, existen 
unos puntos C¿, +... Cy 1 <<... <A s tales que el sistema de los pun- 
tos C++... Ca, es convexamente irreducible y 


Conv (C,, ...p Cs) = Conv LP er Ci.) 


7. Un símplice $ se llama símplice diagonal de un poliedro convexo s-di- 
mensional C generado por un sistema convexamente Irreducible de puntos 
C1, +...» Ca+ 1, Si los vértices del simplice pertenecen al conjunto (Cy, -.., Cs). 

Se dice que un símplice r-dimenslonal A y un símplice $-dimensional B 
están en posición regular (uno con respecto al otro), sí o no se cortan o se 
cortan por un conjunto que es una faceta tanto de un símplice como del otro. 

Tiene lugar la siguiente proposición: 

Existe un conjunto de simplices diagonales de un poliedro $ la) que todo 
punto del polledro pertenece a la unión de estos símplices y' cualesquiera dos 
simplices de este conjunto están en posición regular. 


25—1843 


ler: 
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$ 32. Espacios euclídeos puntuales 


En los parágralos anteriores hemos estudiado las propiedades 
de los espacios afines definidos sobre un Espacio vectorial dado £. 
Supongamos ahora que el espacio vectorial Y es unitario o euclideo. 
Un espacio afín sobre un espacio vectorial unitario (respectivamente, 
euclídeo) Y se llama espacio puntual unitario (respectivamente, 
euclídeo) sobre £. Se llama dimensión de un espacio puntual uni- 
tario sobre Y la dimensión del correspondiente espacio vectorial 
unitario Y. En lo que sigue dedicaremos la atención principal al 
estudio de los espacios puntuales euclídeos sobre el cuerpo de todos 
los múmeros reales. Puesto que el cuerpo de los números reales es 
ordenado, en los espacios puntuales euclídeos está definido el con- 
cepto de convexidad (p. 31.3). 


32.1. Longitud de una quebrada. Sea ll, un espacio puntual 
unitario de 4 dimensiones sobre un espacio vectorial unitario £ de- 
finido sobre el cuerpo conmutativo K. A todo par de puntos Á y B 
de U, corresponde un vector univoco AB de £. Puesto que el espacio 
vectorial £ es unitario, en £ está definido el concepto de longitud 
del vector AB. Indicaremos por p(4, B) esta longitud llamándola 


distancia del punto: A al punto B. Por consiguiente, tenemos por 
definición 


p(A, B)=[4B||=y (AB. AB). (1) 


De las propiedades de las longitudes de los vectores (p. 17.2) 
se desprende que para cualesquiera puntos A y B se tiene 

12 p(A, B)=p(B, A). 

2 e(4, B)=0<>A=B. 

Como para cualesquiera puntos A, B y C de U, se tiene AC = 
= AB+EGC, de la estimación para la longitud de uma suma de vec- 
tores resulta 

3? p(A, B)+p(B, C) >Pp(A, C). 

Un conjunto arbitrario M tal que a todo par A, B de sus ele- 
mentos corresponde un número real no negativo p(A, B) que satis- 
face las exigencias 1”, 2” y 3” se llama espacio métrico de métrica p. 


Por esto la definición (1) convierte un espacio puntual unitario en 
un espacio métrico. 


Aplicando sucesivamente la desigualadad 3”, llegamos fácilmente 
a la desigualdad más general 
p (As, AD+PI(A.» As) + ss +FP(As-1 As) =P (As, As), (2) 


válida para cualquier sucesión finita de puntos A,, ..., A, de un 
espacio puntual unitario. 
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Si un espacio puntual ll, es euclídeo, el campo principal K — 
que es el cuerpo de los múmeros reales—.es ordenado y, por ello, 
todo par de puntos A y B de U,, determina un segmento [A, B] 
(p. 31.1). El número p(A, B) se llama longitud del segmento (A, B)]. 
Dada una sucesión cualquiera de puntos A,, A,, ..., As, la sucesión 
de los segmentos 


[As, As], (Az. As), .... (Ar. Aj] 


se llama quebrada que une A, y A, y el segmento [A,, A,)] se llama 
segmento resultante de la quebrada. La suma de las longitudes de 
los segmentos de una quebrada se llama longitud de la quebrada. 
La desigualdad (2) significa que en un espacio euclídeo cualquiera 
la tongitud de una quebrada es no menor que la longitud de su 
segmento resultante. 

¿Bajo qué condiciones en la desigualdad (2) tiene lugar el signo 
de igualdad? Según el p. 17.2 (para s=2), en un espacio vectorial 
unitario de las relaciones A,A¿=*0 y 


AJA US ALA MH + 114740 11=114,4 ++. + As Ajsll (8) 


se deduce que los vectores A¡A,,, dependen linealmente de A,A, 
y por lo tanto 


AAi=» AA,  (i=l, ..., s—1). 


introduciendo estos valores en (3) y dividiendo por || 4,4, ||. llega- 
mos a la igualdad 


A o (4) 


Si el espacio es euclídeo, los números A,, ..., A,., son reales y la 
igualdad (4) es verídica cuando, y sólo cuando, estos números son 
de un mismo signo. Está claro que en este caso los puntos A,, 
As ..., A, se hallan sobre una misma recta y que los segmentos 
sucesivos [A,, Az). [4,, Au). -.-. [As-,, 4,] de la quebrada se 
intersecan sólo en los correspondientes puntos extremos. Es decir, 
en un espacio puntual euclideo la longitud de una quebrada es igual 
a la longitud del segmento resultante cuando, y sólo cuando, ta 
quebrada es una partición del segrnento resultante. 

Veamos ahora como determinar la distancia entre Jos puntos 4 
y B de un espacio puntual unitario U,, si se conocen las coordena- 


das de estos puntos. Sea (0, e,, ..., e,) una base de referencia 
coordenada de 1l, cuyos vectores forman un sistema ortonormal en 
el espacio vectorial Y*. Indicando por a,, ..., %a Y Bj, -.., P, las 


coordenadas de los puntos A y B en la base de referencia señalada, 
tendremos 


AB=0B-0A=(B,—0,)e,+ --- H(B, —4,,) €, 
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de modo que 
p(4, B)=V1B AP +... +1B_—anT". (5) 


Si el espacio U,, es euclídeo, las coordenadas de los puntos serán 
números reales y, por consiguiente, la fórmula (5) puede ser repre- 
sentada en la forma 


(A, B)=VB,—a + +(B,—a). (6) 


Al deducir estas fórmulas hemos aceptado que los vectores de la 
base de referencia coordenada forman un sistema ortonormal. Estas 
bases de referencia se llamarán ortonormales. Si en lugar de una 
base de referencia coordenada ortonormal se toma una cualquiera, 
la fórmula para la distancia entre dos puntos adquiere una forma 
más compleja que aquí no la daremos. 


32.2. Angulo entre rectas. Consideremos en un espacio puntual 
unitario Y, de n dimensiones dos rectas cualesquiera X y Y. Tome- 
mos en cada una de estas rectas un par de diferentes puntos A,, A, 


y A,, A,, respectivamente. Los vectores A,A, y A,Á, que corres: 
onden a estos pares satisfacen la desigualdad de Cauchy — Bunia- 


ovski O 
(ALÁs, AJA y) | 


11 4143 11-11 As As ll 
Por lo tanto, existe un número real p que satisface la exigencia 


AAA ori 
CLP ALAS 11 Az 8 l (0<o<3). (1) 


Este número q no depende de cómo se escogan los pares indicados 
de puntos en las rectas X y Y. Efectivamente, si B,, B, y B,, B 
son otros pares análogos, se tiene 


B,B,=1-4,A, y B,B,=p:4:4, 
para unos valores adecuados A, p€ K y por ello 


LE BB AL LAS DL cos 9, 
188 -0B3B0 TATI PAGAS ASA 


Luego, el número real q que cumple las exigencias (1) depende 
sólo de las rectas X y Y y se llana magnitud del ángulo entre las 
rectas X y Y o simplemente ángulo entre las rectas X y 9). 

Las rectas X y Y se Mlaman perpendiculares, si el ángulo entre 
ellas es igual a 1/2. De las relaciones (1) se deduce que las rectas 
X y Y son perpendiculares cuando, y sólo cuando, cualquier vector 
que se halla sobre una de estas rectas es ortogonal a cualquier vector 
que se halla sobre la otra recta. 
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Notemos también que el ángulo entre las rectas X y Y) es igual 
a cero cuando, y sólo cuando, las rectas son paralelas. 

En efecto, si las rectas son paralelas, los vectores que se hallan 
sobre estas rectas son linealmente dependientes y por ello en la 
fórmula (1) tenemos A4,4,=14-A,A, y mediante simplificaciones 
directas obtenemos cosp=1 y p=0. Recíprocamente, sea p=0 y, 
por consiguiente, 

|(4,A,, A,JA,) |= | A, As ll: 1! AJA, Il. 
Este es el caso en el que en la desigualdad de Cauchy — Buniakov- 
ski tiene lugar el signo de igualdad. Por consiguiente, A,4,=1-A,A,, 
de modo que las rectas X y 2) son paralelas. 

Fijemos en el espacio unitario U,, una base de referencia coor- 
denada ortonormal (0, e,, ..., €,). Como sabemos las ecuaciones 
de las rectas X y Y pueden ser representadas en la forma 


Ei... hb 
a pá T £, (2) 
E-=m_ . _b=m_, (3) 
my a Mr ] 
donde t es un parámetro y l,, ..., l, y M,, -.., fm, son los coefi- 
cientes directores. Supongamos que el punto A, se obtiene para el 
valor ¿=f, (i=1, 2, 3, 4). Indicando por «;,, ..., ;, las coorde- 


nadas del punto A¡(¿=1, 2, 3, 4), tendremos 
as =! 4 ¡+E (1, 2 s=1l, ..., n), 
aj =mjt¡+nN (1=3, 4; s=1, ...,n) 
y, por consiguiente, 4 
AJA, =(t,—1)(10,+--- +), 
AJA,=(t,—t,) (me, +... +m,e,). 
introduciendo en la fórmula (1) estos valores, obtenemos 
SS lm +...+!1ni5 | 
A de 
Esta es la fórmula estandard para ej coseno del ángulo entre unas 
rectas dadas por las ecuaciones canónicas (2) y (3) en un sistema 


de coordenadas ortonormal. Tomando la recta (3) como la recta 
coordenada s-ésima, definida por las ecuaciones 


y -.- ind 
e indicando por «q, el ángulo entre la recta (1) y esta recta coor- 
denada, obtenemos e 


COS = A ———— 
ES VTAPA EI P 
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y, en particular, 
coto, +... + cos q, 1. (5) 


Hemos visto ya en el p. 30.3 que la condición de paralelismo 
de las rectas (2) y (3) puede ser representada en la forma 


Ho + 


A 
Tomando en la fórmula (4) p=3. llegamos a la relación 


[m +... +11, =0, (6) 


que representa la condición de perpendicularidad de las rectas dadas 
por tas ecuaciones canónicas en una base de referencia coordenada 
ortonormal. 

En los espacios puntuales euclídeos se introduce también, ade- 
más de) concepto de ángulo entre rectas, el concepto de ángulo 
entre rayos. Las ecuaciones canónicas de los rayos en un espacio 
euclideo r-dimensional puntual también se representan en la forma 
(2) y (3), donde Ef. ..., E% y mn, -.., ná son las coordenadas de 
los vértices de estos rayos, y las coordenadas É,, ..., £, de un 
punto arbitrario de estos rayos se obtienen de las ecuaciones indi- 
cadas dando al parámetro f unos valores no negativos arbitrarios. 
Puesto que el campo principal es en este caso el cuerpo de Jos 
números reales, existe un número real único q que cumple las 
exigencias 


imy+.. kim, 
Var... +2 Vm+...+m 
Aer se denomina ángulo entre los rayos señalados. Según estas 
efiniclones el ángulo entre cualesquiera rectas está comprendido 
siempre en los límites O y 5. mientras que el ángulo entre unos 


rayos puede ser también obtuso. Supongamos, por ejemplo, que un 
rayo está dado por sus ecuaciones canónicas 


0 0 
e =( (t > 0). 


La ecuación del rayo opuesto que con el rayo dado forma una 
recta integra es entonces de la forma 


e 0 
EE =.. hi =|( (t<0) 
o en lorma canónica 


EE >. HB (t>0) 


—4, — + 


cosq = (<9+<m, (7) 
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Calculando el ángulo entre estos rayos opuestos según la fórmula 
(7), obtenemos cosp = —1 y por lo tanto p=x. 


32.3. Proyecciones ortogonales. Empleando el concepto de per- 
endicularidad de rectas es fácil definir la relación de perpendicu- 

aridad de unos planos *-dimensional y ¿-dimensional en un espacio 
unitario U,. Se dice que la recta X del espacio U, es perpendicular 
a un plano Wi k-dimensional de M,, lo que se indica simbolicamente 
por X*_1 Mi, si X es perpendicular a cualquier recta que pertenezca 
a 

Puesto que la perpendicularidad de las rectas equivale a la 
ortogonalidad de los vectores no nulos que se hallan sobre ellas, 
se tiene e 

xL¿MoOX_ WD, (1) 
donde Vi significa el subespacio tangente al plano M (en las nota- 
ciones del p. 29.3 se tiene M =L (MI). 

Una recta X se llama perpendicular trazada desde el punto A 
hacia el plano Vi, si X pasa por A, es perpendicular a Wi y se 
corta con Yi en un punto P, El punto P se llama base de la 
perpendicular trazada desde A hacia Wi o proyección de A sobre Mi. 

TEOREMA 1 En un espacio unitario YU, de n dimensiones desde 
todo punto A que no se halle sobre un plano arbitrario k-dimensional 
M(1<e<n— 1) se puede trazar una perpendicular hacia M, y 
sólo una. 

UNICIDAD. Supongamos que existen dos rectas diferentes AVB y 
AVC (BC; B, CEM) perpendiculares a Wi. Estas rectas deben 
ser entonces perpendiculares a la recta ByC que se halla sobre el 
plano Wi. 

Supongamos que las rectas AVB, AVC y By C— que se hallan 
obviamente sobre el plano bidimensional AY BWC—-+tienen, en una 
base de referencia ortonorma) del plano AVBVC, los coeficientes 
directores (1,, ¿,), (M,, My) y (At,, n,), respectivamente. La condición 
de ortogonalidad de las rectas AYWB y BvC implica la igualdad 
([,n, +!1,n,=0 (véase (6)), análogamente la ortogonalidad de AvyC 
y de BVC implica la igualdad m,n,+m,n,=0. Vemos que el 


sistema 
lx, + d¿x,=0, l 
mx, +my,x, =0 ) 
tiene una solución no trivial (n,, n,). Por consiguiente, 


by A ml 
m, my, 
es decir, E. Luego, las rectas AYB y AVC son paralelas 
(véase el p. 30.3) y tienen un punto común A. De aquí se des- 
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prende que ellas coinciden. La contradicción ohtenida concluye la 
demostración de la unicidad. 

EXISTENCIA. Supongamos primero que M es un hiperplano, es 
decir, que k=n—1. En U, existe, según el p. 17.5, un subespacio 
vectorial de una dimensión MA ortogonal a M. El conjunto A-DiL 
es una recta que pasa por A y es perpendicular a WM. Resta probar 
solamente que A-MI se interseca con Vi. Pero, esto es evidente, 
ya que en el caso contrario la recta A-ML sería paralela a M y 
por lo tanto en M existiría una recta paralela (y no perpendicular) 
a A-Mia, 

Si ahora M no es un hiperplano de Ú,,, consideremos el subes- 
pacio N=AVM. El conjunto M es un hiperplano del espacio 
unitario ÑN. Luego, según lo anterior, desde A se puede trazar 
dentro de N una perpendicular hacia D?. Es obvio que esta perpen- 
ar será también una perpendicular dentro del espacio prin- 
cipal U,. 

En el teorema (1) se resuelve el problema sobre la posibilidad 
de trazar desde el punto A una perpendicular de modo que corte 
el plano D?. Veamos cuál es la situación, si omitimos esta exigen- 
cia. Según el p. 17.5, el conjunto Mi de todos los vectores del 
espacio 4, ortogonales a Di es un subespacio vectorial de dimensión 
n—k. Por esto el conjunto A-MiL será el conjunto de los puntos 
que se hallan sobre todas las rectas que pasan por AÁ y que son 
perpendiculares a M. Puesto que ML es un subespacio vectorial de 
dimensión n—Rk, el conjunto A-MÉA es un plano (n —k)-dimensional. 
La intersección de A-Mi1L y de M? no puede contener ninguna recta 
X, ya que en el caso contrario cualquier vector que se halla sobre X 
pertenecería simultáneamente a los espacios Mi y MIL, lo cual es 
imposible. Por consiguiente, la intersección de VW? y A-ViL o es 
vacía o consta de un solo punto. Si A€ Mi, la intersección de M 
y A- MEL consta, obviamente, del punto A. En cambio, si AÉM, 
a base de la perpendicular trazada desde 4 hacia M pertenece 
simultáneamente a 4-M1 y a M y, por ello, el conjunto Mn A4-Di 
está formado solamente por la base de la perpendicular mencionada. 
El plano A-Mu suele llamarse a veces complemento ortogonal a M 
trazado por el punto A. En particular, si Wi es un hiperplano y 
AM, el complemento ortogonal A- ML es la recta que es perpen- 
dicular al hiperplano M y que lo intercepta en el punto A. Esta 
recta se llama perpendicular al hiperplano Wi levantada desde el 
punto A. 

Se llama proyección (con más precisión, proyección ortogonal) de 
un punto A sobre un plano cualquiera Wi el punto de intersección 
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de los planos M y A-WiL, En otras palabras, si AFW, se llama 
proyección de A sobre Wi la base de la perpendicular trazada desde A 
hacia Vi. Si A€ WM, se llama proyección de Á sobre Wi el propio 
punto A. La proyección de A sobre Mi se indica a veces por Prey A 
o por Am. La aplicación Prm:11, — M se llama proyección (orto- 
gonal) del espacio U,, sobre el plano M. 

Veamos cómo se expresan las coordenadas de la proyección del 
punto A sobre el plano MM en términos de las coordenadas de Á. 
Tomemos en el espacio Wi una base orto- 
normal e,, ..., €, y conplementémosla con 
los vectores €», 1, -.., €, hasta obtener una 
base otronormal €,, ...,€, ..., €, de todo 
el espacio 11,. Fijemos en M un punto 
cualquiera O y tomemos como base de 
referencia coordenada de U, la base de 


referencia (O, €,, -.., €,). Sean Q,, ..., Ln 

las coordenadas del punto 4 en esta base 

de referencia. Demostremos que la proyec- Fig. 10. 

ción de A sobre Di será el punto P con 

las coordenadas %,, ..., %, 0, ..., O (véase la fig. 10 para £= 2). 
En efecto, el plano Di consta de los puntos cuyas filas coordenadas 
son de la forma (E,, ..., Ez, 0, ..., 0). Por esto todo vector x 


perteneciente a DM puede ser representado en la forma E,e,+... 


..« +EEjp. Pero PA =0p 41231 + >>. +02, y por lo tanto se tiene 
(x, PA)=0, es decir, la recta PV A es perpendicular al plano DM 
que es lo que se quería demostrar. Luego, si 


OA=a,e +... OL +. +0 En 
resulta 


OA9=0e, +... +0% e» (2) 
NN =0 V Oe, Y e... V 0€». 
De la fórmula (2) se desprende directamente el siguiente teorema 
importante. 
TEOREMA 2. La proyección ortogonal Pra:U,, — M es una aplica- 


ción lineal, es decir, para cualesquiera puntos AV, AW, AW, qu, 
A" y A” y para cualesquiera números A, HE K la relación 


donde 


DAD SW ADA o AA (3) 

implica 
APAD 1: ADA? y y ADA. (4) 
Efectivamente, indicando por e, ..., ad las coordenadas del 


punto AY (¿(=1, ..., 6) y tomando en consideración la condición 
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(3), obtenemos las igualdades 
ae — ao ao — a) (ajo —ag9)  (s=k. ..., m. (5) 
Por otra parte, debido a (2), tenemos 


ADARAO = (aga) e +... Hat —aj") e (1=2, 4, 6). (6) 
Comparando (6) y (5) llegamos a la relación (4). 

Se llama proyección Es de un conjunto arbitrario de puntos 
sobre un plano M el conjunto de las proyecciones sobre WD de todos 
los puntos de €. 

TEOREMA 3. La proyección de una recta X sobre un plano cual- 
quiera M es una recta o un punto. Si XW, ..., X'% son unas rectas 
de un espacio unitario UY, y Vi es un plano cualquiera de M,,, se 
tiene 

(EOVY... VXS) y = A VAS (7) 

Tomemos en cada una de las rectas XY un par de puntos dife- 
rentes 4%, B% (i=1, ..., s). El plano XWYy... y X9 está for- 
mado por aquellos puntos C para dos cuales 
ADC=1,:ADBD + e +2, ABS + 

+ ABAD E AMAS (8) 


para unos valores adecuados A,, ..., As, Pays ---, MEK (véase el 
p. 29.2). Basándonos en (4), obtenemos de aquí 


ADC => ABRA +2, AP BR + | 
+ APA Y 1, APA, (9) 


de modo que 
Cm = (AP V BR IV... VILAR v BS). 
Reciprocamente, si 


DELAS V BRYV ... VIAN V BÑÑ), 
para valores adecuados A,, ..., As Hgo ---, ME K se tiene 
ARPD=A ABR +. +2, AQ BR + 


+ APA ep AÍDA (10) 
Tomemos en el espacio X"VY...YX'" un punto C tal que se 
cuinpla la igualdad (8). Comparando (9) y (10) vemos que Cm =D 
y por ello DE(XWVY... VX'")yw. Vemos, por consiguiente, que 
(AMY XP Da mu (ARO V BEI V VIA VB). 


Para sel obtenemos X£?= ALP Y BiP. Por consiguiente XN == 
>= A Y BÍXR y quedan demostradas ambas afirmaciones del teorema 3. 
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COROLARIO. En un espacio unitario la proyección de un plano N 
sobre otro plano es de nuevo un plano cuya dimensión no sobrepasa 
la dimensión de Mi. 

Para la demostración es suficiente representar el plano N en 
forma de la adherencia lineal de las rectas independientes que 
pasan por un punto y aplicar la fórmula (7). 

En los espacios puntuales euctídeos están definidos los conceptos 
de segmento y de cuerpo convexo. Mediante la fórmula (4) se 
comprueba fácilmente el teorema siguiente. 

TEOREMA 4 En un espacio puntual euclideo la proyección de un 
segmento cualquiera [A, B] sobre un plano Vi es un segmento [Awm, 
Bm] y por ello la proyección de cualquier conjunto convexo es un 
conjunto convexo. 


En efecto, si CE[A, 8), se tiene AC=1.AB, 0<1<l. De 
aquí se deduce, debido a (4), que AnUm =1- AmBm y por lo tanto 
Cx€[4u, Bu] y [4, Blu <S[4x, Bw]. Reciprocamente, si DE [Am, 
Ba], para un valor conveniente de 4 (0 <4A< 1) tenernos ÁmD = 
=4-AmBw. Tomando en el segmento [A, B] un punto C tal que 
AC=A-AB y comparando (4) con la igualdad 4AmD=4-AmBm, 
obtenemos D=Cm y, por consiguiente, (Am, By] < (4, B]m que es 
lo que se quería demostrar. 

Veamos cómo pueden calcularse las coordenadas de la proyección 
de un punto dado sobre un hiperplano dado, si se conocen las 
coordenadas del punto y la ecuación del hiperplano. Sea (O, e,, ...,€,,) 
una base de referencia coordenada ortonormal de un espacio unitario, 


sea B un punto de coordenadas f,, .... B, y sea 
Et... +0, =0 (11) 
la ecuación del hiperplano dado. Consideremos dos puntos distintos 
cualesquiera C y D de coordenadas respectivas y,, ..., Yn Y Om +...» On 
que se hallan sobre el hiperpiano (11). Tenemos entonces 
CD=(6,—Y)e +... + (6, — Y 11) €n- (12) 


Las coordenadas de C y de D deben satisfacer la ecuación (11). 
Introduciéndolas en la ecuación (11) y restando término por término 
las dos igualdades obtenidas, encontramos 


(0, —yY) +... +0. (0, — yn) =0. (13) 
De (12) y (13) vemos que la recta 
Ted TU A =in—Bn (14) 
A) Xp 


es perpendicular a cualquier vector CD que se halle sobre el plano 
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(11) y, por ende, es perpendicular a este plano. Puesto que la rec- 
ta (14) pasa por el punto B, las ¿¡gualdades (14) son las ecuaciones 
canónicas de la recta que pasa por el punto dado B de coordenadas 
B, ..., B, y que es perpendicular al plano dado (11). 

Resolviendo conjuntamente las ecuaciones (11) y (14), encontra- 
mos las coordenadas 


E = Tb and lis Lo... 2) 


E E 
de la proyección de B sobre el hiperplano (11). 
32.4 Angulo entre un plano y una recta. Consideremos un plano 


arbitrario Wi R-dimensional perteneciente a un espacio unitario U 
de n dimensiones y una recta cualquiera X de este espacio que 
intercepta el plano Dl en el punto A. La proyección de la recta X 
sobre el plano M es una recta Xy que pasa por el punto A. El 
ángulo entre la recta X y su proyección Xm se llama ángulo entre 
la recta X y el plano Mt (fig. 11). Si la recta X se halla sobre el 
plano Vi, se tiene X=Xauw y el ángulo 
entre X y MW es igual a cero. Si X no se 
halla sobre el plano WM, existe el único 
plano (%*-+4 1)-dimensional N que pasa 
por Wi y X. El plano DI es un hiperplano 
en el espacio N y por ello se puede 
trazar en N sólo una perpendicular Y 
a WM por el punto A. Sea B:un punto 
Fig. 11. cualquiera de * diferente de A y sea C la 
proyección de B sobre Wi. La recta B Y C 
se halla en el espacio M y es perpendicular a Wi. Todas las per- 
pendiculares a un mismo hiperplano son paralelas (véase el p. 32.3) 
y por esto las rectas Y, X y AVC (véase la fig. 11) se hallan 
sobre un mismo plano bidimensional. De aqui se deduce que el 
ángulo p entre X y Wi y el ángulo y entre X y Y dan en suma y/2. 
Resta considerar el caso en que el plano R-dimensional Vi y la 
recta Y no se intersecan. Tornemos sobre el plano Vi un punto 
cualquiera A. En el espacio 1 existe, según el p. 30.3, una recta única 
X' que pasa por el punto A y que es paralela a la recta X. El ángulo 
entre la recta X” y el plano Vi se llama en este caso ángulo entre 
la recta X y el plano M. Es fácil comprobar que el ángulo entre 
la recta X y el plano Di definido de esta forma no depende de cómo 
se escoja el punto auxiliar A. 
Supongamos que en un espacio U se ha fijado una base de re- 
lerencia ortonormal (O, e,, ..., €,) y que en esta base de referencia 
están dados un hiperplano Wi por medio de la ecuación 


AS (1) 
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y una recta X mediante sus esuaciones canónicas 
EA _ _Em—En (2) 
ias mua 


Tomemos en el hiperplano Di un punto A y sean 0,, ..., 6, Sus 
coordenadas. Entonces las ecuaciones de la recta X” que es paralela 
a X y que pasa por Á son 


EL = 
si... 307% (3) 


1 ln j 


y las ecuaciones de la perpendicular 2) levantada en el punto A 
acia el hiperplano Mi serán 


— J Er —0n 
7 A ES (4) 
Por lo visto en el p. 32.2, para el ángulo + entre X” y Y se tiene 


cos y = TU O | 


n [a +... FT 0, 1* V ILP+...+ TP 


y, por consiguiente, el ángulo q entre UV y X satisface las relaciones 


_ Jaydi+... tamal 
SP Van VIA BE PILA P (5) 
(0<p<3). 


Igual que en el espacio euclídeo corriente, el ángulo entre una 
recta y un plano en un espacio unitario posee la propiedad de 
extremalidad. 

TEOREMA. Supongamos que en un espacio unitario Ú,, de n dimen- 
siones una recta X se corta: con un plano R-dimensional M en un 
punto A formando un ángulo q diferente de O y de 1/2. Entonces 
el ángulo entre X y cualquier recta Y, que pasa en el plano M por 
A y es diferente de la proyección de X sobre Mi, es mayor que y. 

Tomemos sobre X un punto cualquiera B diferente de A y tra- 
cemos desde B hacia DW una perpendicular indicando su base por C. 
Indiquemos por D la base de la perpendicular trazada desde el 
punto B hacia la recta 3 (véase la fig. 11). Puesto que la recta 


BV C es perpendicular al plano M, los ángulos BCD y BCA son 
rectos. El ángulo BDA es recto por construcción. De los triángulos 
rectángulos BCA, BDA y BCD obtenemos, respectivamente 


senp= 33, sen(X, 8)=5% y BD=VBC+ DO > BC. 


Luego, seno <sen(X, 3) y P< Z(X, 3) que es lo que se quería 
demostrar 
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Ejemplos y problemas 


En los problemas que se ofrecen a continuación se supone que en cada uno 
de los casos se ha escogido y se ha fijado una base de referencia ortonormal 
del espacio puntual euclídeo y que los puntos de este espacio se dan por las 
dediracee calculadas en esta base 

Hállese ZA, ortogonal del mento [(0, 0,0, 0). (4, — 1, — 3, 4)) 

a el plano Ay Y Ay Y Ay V As, donde las Ae coordenadas de los 

puntos Ai ¿ 527 le respectivamente, (0, 0, 0, 0,), (1, 1, ), ), 
fl, a 2, —1l) y Ñ 0, 

. Se Mama distancia 7 un punto Á a un plano M el mínimo de las dis- 

E entre el punto dado y los puntos de M. Demuéstrese que esta distancia 


es igual a la longitud del vector APTA. 


3. Hallénse las longitudes de los lados y los ángulos nera del triángulo 
cuyos a están dados por las filas coordenadas (2, 4, 2, 4, 2), (6, 4, 4, 4, 6) 
y (5, 7 

4. Hállese el ángulo entre la recta A, V B y el plano Ay V A, Y 4x2. donde 
las filas coordenadas de los puntos An As Az y B e iguales, respectivamente, 
a (0, 0, 0, 0), (3, 4, —4, —1), (0, l, 1, 2) y (2, 2 . 1, 1). 
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